文档文库
手机版
投诉建议
热门搜索:
心得体会
演讲稿
思想汇报
首页
心得体会
学习心得体会
培训心得体会
军训心得体会
社会实践
作风建设
工作心得体会
教育心得体会
演讲稿
演讲稿格式
演讲稿范文
竞聘演讲稿
师德演讲稿
三分钟演讲稿
思想汇报
思想汇报范文
转正思想汇报
大学生思想汇报
季度思想汇报
教师思想汇报
工作计划
工作计划格式
工作计划开头
工作计划结尾
总结与计划
工作计划模板
工作总结
年终工作总结
年度工作总结
个人工作总结
实习报告
实习报告范文
实习计划范文
实习鉴定范文
实习报告内容
个人简历
求职简历
简历范文
简历模板
简历表格
简历格式
祝福语
春节
除夕
元宵
端午节
合同范文
合同范本
合同样本
合同范本格式
首页
>
正在进行安全检测...
正在进行安全检测...
发布时间:1714394555 来源:
文档文库
小
中
大
字号:
手机查看
浙江万里学院
毕业论文(设计)报告纸
┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
计算机与信息学院
本科毕业论文(设计)文献综述
浅谈数据挖掘
0
前言
随着网络的迅猛发展,依托于网络的网络购物做为一种新型的消费方式脱颖而出,在全国
乃至全球范围内都在迅猛的发展。网络购物行业也越来越得到更多人的关注,与此同时,各种
研究方法、数据分析方法也被运用到了关于网络购物的研究当中。数据挖掘技术作为一种新的
数据分析方法逐步应用到网络购物的分析中,获取数据、抽取规律、预测趋势、建立模式,这
对促进网络购物行业的健康、有序发展是十分有益的。本研究使用数据挖掘的方法,借助
SAS
工具,以阿里巴巴大数据竞赛的真实数据为基础,对天猫用户购物行为进行了研究分析。
1
什么是数据挖掘
数据挖掘
(英语:
Data mining
)
,
又译为资料探勘、
数据采矿。
它是数据库知识发现
(英语:
Knowledge-Discovery in Databases
,简称:
KDD
中的一个步骤。数据挖掘一般是指从大量的数
据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在
线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法
来实现上述目标。
在较浅的层次上,
它利用现有数据库管理系统的查询、
检索及数据挖掘功能,
与多维分析、
统计分析方法相结合,进行联机运算分析处理,从而得出可供决策参考的统计分析数据的一个
有商业意义的结果,这个结果可以出售给需要的卖家,这就是所谓的大数据分析。
在深层次上,则从数据库中发现前所未有的、隐含的知识。例如:在大街上川流不息的车
流量,在普通人眼里,当你通过一个十字路口时,可能会看到除了塞车就是车祸,亦或者没有
事的安全通行,
没有其他的信息可能会有,
如果是一个数据挖掘人员就会发现其中的数据信息,
一小时会有横向会有多少车流量,竖向会有多少车流量,这样可以得到一组数据,通过数据挖
掘分析后得到更有的结果,十字路口的红绿灯就可以根据车流量设置时间长短。而从另一个角
度,如果在十字路口进行路线测绘的话,就可以得到类似地图的数据,手机中的导航软件就是
通过这样实现的,所以我们生活中数据挖掘无处不在,只是在我们不认识数据挖掘时,不会去
发现。
2
数据挖掘的任务
数据挖掘的两个高层目标是建立模型和预测。前者指用一些变量或数据库的若干已知字段
装
┊
┊
┊
┊
┊
订
┊
┊
┊
┊
┊
线
┊
┊
┊
┊
┊
┊
┊
┊
┊
浙江万里学院
毕业论文(设计)报告纸
通过相应的数据挖掘分析软件,以及某些情况下需要实地考察,再结合团队间的分析,结合数
┊
┊
┊
┊
┊
┊
┊
┊
┊
┊
据挖掘的相应模块导出一个比较合理性、可行性、具有预测性的模型,而后者是建立在前面的
分析好后,通常,预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该
模型用于对未知变量的预测。从这种意义上说,预测的目的就是对未来未知变量的预测,这种
预测需要时间来验证,所以他需要更加具体化的分析出一些较为能大众接受的信息,分析出相
应的规律,总结出相关的报告,来确认验证这一预测。
3
数据挖掘的特点
数据挖掘技术具有以下特点:
(1
数据挖掘基本分为
3
步骤:数据准备、规律寻找和规律表示。
(2
数据的主要分析方法有:关联分析、聚类分析、分类分析、异常分析、特异群组分析和
演变分析等。
(3
需要处理的数据规模十分庞大,达到
GB
、
TB
数量级,甚至更大,所以数据挖掘常被较
为“大数据挖掘”
。
(4
在许多些应用
(
如商业投资等
中,由于数据变化迅速,因此要求数据挖掘能快速做出相
应反应以随时提供决策支持。
(5
数据挖掘往往需要把一些无规律,大数量级的,含有偏离点的(因特殊因素而导致的不
正常的数值)
,在有效的时间内转换成有规律,无瑕疵的,主要预测动向的模型。
(6
在某种角度上,数据挖掘也是可以与用户知识库交互,从用户的数据中寻找规律,并且
规律是可视化的。
4
数据挖掘的过程
数据挖掘的步骤会随不同领域的应用可能有所变化,每一种数据挖掘技术也会有各自的特
性和使用步骤,所以首先需要明确业务对象清晰地定义出业务问题,认清数据挖掘的目的是数
据挖掘的重要一步。挖掘的最后结构同样是不可预测的,但要探索的问题应是有预见的,为了
数据挖掘而数据挖掘则带有盲目性,是不会得到理想的结果的。
(1
数据的准备与选择。搜索所有与研究对象有关的内部和外部数据信息,并从中选择出适
用于数据挖掘应用的数据。
(例:
在中国统计局官网上就可以搜索到往年的与国家经济有关的数
据资料)官方的数据也较为真实可靠,具有挖掘价值。
(2
数据的预处理。主要是分析并提高数据的质量,排除一些因某些特殊因素而引起的特殊
值,会影响整个数据组的最后预测效果。
(3
模型的建立。通过数据挖掘软件(例如:
SAS
)将数据转换成一个分析模型,这个分析
模型是针对挖掘算法建立的,建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。
(4
数据的预测。
建立模型之后,
在模型上会有一些本来用于分析的数据
,
也会有未来的一些经过
装
┊
┊
┊
┊
┊
订
┊
┊
┊
┊
┊
线
┊
┊
┊
┊
┊
┊
┊
┊
┊
本文来源:
https://www.2haoxitong.net/k/doc/3bb58de4876fb84ae45c3b3567ec102de3bddfe2.html
《正在进行安全检测....doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档
文档为doc格式
分享到:
相
关
案
例
正在进行安全检测...
2024-04-29
正在进行安全检测...
2024-04-29
安全验证
2024-04-29
正在进行安全检测...
2024-04-29
正在进行安全检测...
2024-04-29
正在进行安全检测...
2024-04-29
正在进行安全检测...
2024-04-29
正在进行安全检测...
2024-04-29
安全验证
2024-04-29
正在进行安全检测...
2024-04-29
相关推荐
推荐内容