数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。45160
知识发现过程由以下三个阶段组成:(1)数据准备,(2)数据挖掘,(3)结果表达和解释。数据挖掘可以与用户或知识库交互。
数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。
数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析,等等。
就目前而言,关联规则挖掘技术已经被广泛应用在西方金融行业企业中论文网,它可以成功预测银行客户需求。一旦获得了这些信息,银行就可以改善自身营销。现在银行天天都在开发新的沟通客户的方法。各银行在自己的ATM机上就捆绑了顾客可能感兴趣的本行产品信息,供使用本行ATM机的用户了解。如果数据库中显示,某个高信用限额的客户更换了地址,这个客户很有可能新近购买了一栋更大的住宅,因此会有可能需要更高信用限额,更高端的新信用卡,或者需要一个住房改善贷款,这些产品都可以通过信用卡账单邮寄给客户。当客户打电话咨询的时候,数据库可以有力地帮助电话销售代表。销售代表的电脑屏幕上可以显示出客户的特点,同时也可以显示出顾客会对什么产品感兴趣。
同时,一些知名的电子商务站点也从强大的关联规则挖掘中的受益。这些电子购物网站使用关联规则中规则进行挖掘,然后设置用户有意要一起购买的捆绑包。也有一些购物网站使用它们设置相应的交叉销售,也就是购买某种商品的顾客会看到相关的另外一种商品的广告。
但是目前在我国,“数据海量,信息缺乏”是商业银行在数据大集中之后普遍所面对的尴尬。目前金融业实施的大多数数据库只能实现数据的录入、查询、统计等较低层次的功能,却无法发现数据中存在的各种有用的信息,譬如对这些数据进行分析,发现其数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和商业兴趣,并可观察金融市场的变化趋势。可以说,关联规则挖掘的技术在我国的研究与应用并不是很广泛深入。
本文将以七大新兴产业的发展现状为研究对象,运用数据挖掘的知识,得出七大新兴产业的发展现状排名。
附:参考文献目录
1、 郑晓. 产业结构与经济增长[D].广州:中央校,2012
2、 王勇. 大数据环境下竞争情报系统的研究与实现[N].广东工业大学学报,2014-09-03.
3、 张雪英. 国外先进数据挖掘工具的比较分析[N].计算机工程,2003-09-16.
4、 钱峰. 基于SPSS知识地图的国内数据挖掘研究现状分析[N].情报科学,2008-06-06.
5、 纪瑶. 区域战略新兴产业竞争力的评价研究[D].南京:南京工业大学,2013.
6、 梁循. 数据挖掘:建模、算法、应用和系统[N].计算机技术与发展,2006-01-01.
7、 胡文瑜. 数据挖掘取样方法研究[N].计算机研究与发展,2011-04-05.
- 上一篇:中国反洗钱工作现状开题报告
- 下一篇:ERP系统实施开题报告
-
-
-
-
-
-
-
NFC协议物理层的软件实现+文献综述
巴金《激流三部曲》高觉新的悲剧命运
浅析中国古代宗法制度
现代简约美式风格在室内家装中的运用
江苏省某高中学生体质现状的调查研究
C++最短路径算法研究和程序设计
上市公司股权结构对经营绩效的影响研究
g-C3N4光催化剂的制备和光催化性能研究
中国传统元素在游戏角色...
高警觉工作人群的元情绪...