摘  要:近来互联网快速发展,使人们进入了大数据时代.大数据时代的一个主要特征是数据增长的速度越来越快,人们需要做的是思考哪些数据是有价值的,并且知道如何利用这些数据.由于数据挖掘技术的方法很多,并且每一种方法都有自己的独到之处,那么对于数据挖掘方法的选择并不是一成不变的,很多方法之间都是相互联系、相互补充的.本文介绍了数据挖掘常用的方法,对每一种方法的优势和不足之处做了总结,并介绍了数据挖掘技术用到的领域.通过对数据挖掘的探究,使人们对数据挖掘有更清晰的认识,重视数据挖掘技术所带来的价值.31183
毕业论文关键词:数据挖掘;聚类;神经网络;决策树
Commonly Used Methods of Data Mining
Abstract: Recent rapid development of the Internet, so that people entered the era of big data. A key feature of the era of big data is the data growing faster and faster, people need to do is to ponder what data is valuable, and know how to use these data. Since the method of data mining technology a lot and each has its own unique, so the choice of data mining is not static, are interrelated among many ways complementary. This article describes the data mining common approach , each approach 's strengths and weaknesses summarized and presented in the field of data mining techniques used by data mining exploration , data mining so that people have a clearer understanding , attention data mining technology brings value.
Keywords: Data mining; Clustering; Neural network; the decision tree
目    录

摘 要    1
引言    2
1. 数据挖掘概述    3
1.1数据挖掘的定义    3
1.2数据挖掘常用的方法    3
1.2.1分类    4
1.2.1.1决策树    5
1.2.1.2 KNN法(K-Nearest Neighbor)    6
1.2.1.3朴素贝叶斯分类    7
1.2.1.4人工神经网络    8
1.2.2聚类    10
1.2.2.1算法分类    10
1.2.2.2常用的算法    11
1.2.3回归分析    12
1.2.4关联规则    14
2数据挖掘的应用    17
2.1数据挖掘在医学上的应用    17
2.2数据挖掘技术在金融领域的应用    18
2.3数据挖掘技术在电子商务中的应用    19
3数据挖掘技术所面临的挑战    20
4结束语    21
参考文献    22
致谢    23
浅谈数据挖掘的常用方法
引言
     随着互联网的发展,人们每时每刻都在创造者大量的信息,交易信息、消费信息、社会信息等等,这些数据包括结构化和非结构化,整体是一个很复杂的数据集,我们不知道哪些信息是有用的,哪些是无价值的,能做的就是想尽办法把这些信息存储起来,说不清楚有多少存储在全世界有多少未被使用的信息存储在世界各地.计算计存储数据的速度很快将超过人们使用信息的能力.如果我们能够找到数据中隐含的规律或者有价值的信息,那这些巨大的数据就能为人们创造价值,而不是积累在数据库中.因此,需要不断的探究数据中隐含的规律或者有价值的信息.数据挖掘技术的定义与另一个术语“知识发现”(KDD)联系紧密,区别和联系并存.有观点认为,KDD可以被看成是数据挖掘技术的一个特殊方式.但是数据挖掘不仅仅是数据发现,它还包含数据的去噪、计算、建模等步骤.这就是数据挖掘技术.
对于数据挖掘的研究,国外要先进很多,并建立了很多相关的数据挖掘工具,如R语言、SAS、SPSS、Matlab等等.和国外比较,中国对这一块的重视近年来才开始,整体上还出于初始阶段,并且做这些工作的人主要是科研机构,高校等.那么对数据挖掘的实际应用更是很少,如今我们可以看到互联网上都在说大数据,但实际上很多公司都没有实际的去尝试,并没有把数据挖掘技术当作决策的一种有效手段.不过幸运的是国内很多大型企业已经注意到数据挖掘的价值,都开始投入巨资研究,如百度投资3亿美元在硅谷设立研发中心,专门从事数据挖掘的应用研究.阿里、京东都在招聘数据挖掘科学家等等.这说明企业都开始认识到数据的力量,这是一个很好的开始.
上一篇:多元函数条件极值的计算及其应用
下一篇:GDP增长和股市收益率的相关性研究

浅谈中学数学函数最值问题的求解方法

基于决策树算法的篮球联赛预测

数形结合在中学数学中的...

浅谈圆周率

浙江省工业企业发展的因子分析

中美小学数学课堂教学的比较

杭州历年中考三角形的题型分析

志愿者活动的调查问卷表

C#学校科研管理系统的设计

10万元能开儿童乐园吗,我...

公寓空调设计任务书

承德市事业单位档案管理...

AT89C52单片机的超声波测距...

神经外科重症监护病房患...

中国学术生态细节考察《...

医院财务风险因素分析及管理措施【2367字】

国内外图像分割技术研究现状