3.1.3 基于密度的聚类 14
3.1.4 基于网格的聚类 14
3.2 隶属度函数确定的方法研究 15
3.3 本章小结 17
4 算法的实验分析和简单的应用实践 17
4.1 算法在学生成绩数据上的实验分析 17
4.2 算法在私人银行客户数据中的应用实践 23
4.3 本章小结 27
结 论 28
致 谢 29
参考文献 30
1 绪论
1.1 研究背景及意义
上世纪80年代末到90年代初,国内外广泛流传着一句耐人寻味的话语:我们沉浸在数据的海洋中,却渴望着知识的淡水。这句话生动地描绘了当时人们面对海量数据的迷惘和无奈。就在这时,世界商业巨头沃尔玛从其庞大的交易数据中演绎了一场“啤酒和尿布的故事”,揭示了一条隐藏在海量数据中的、美国人的一种行为规律:年龄在25~35岁的年轻父亲下班后经常要到超市去给婴儿买尿布,而他们中的30%~40%的人顺手为自己买几瓶啤酒。受这条简单的客户行为模式的启发,沃尔玛调整了商品布局,并策划了促销价格,结果销售量大增。这一现象引起了科学界的注意,他们将“啤酒与尿布的故事”引申为“关联规则的获取”,进而将“从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道、但又潜在有用的信息和知识的过程”定义为“数据挖掘”。需求是成功之源,于是西方发达国家刮起了一场数据挖掘风暴。商业界发现了沃尔玛迅猛发展的秘诀,纷纷效仿。电信行业也沸腾了,各公司纷纷争先恐后地利用数据挖掘这一锐利武器解决他们面临的最紧迫的问题(如客户分群、客户流失原因及预测、业务套餐及响应、关联消费等)。工业界也行动了,他们从堆积如山的数据中,挖掘出知道生产和管理的决策原则。
经过多年的发展,商业银行信息系统已经逐步完善,同时拥有海量的数据资源,但一直以来这些数据资源没有被有效地开发利用。而银行的业务数据质量高、准确度高,通常比较完善、可靠,这对于系统化的数据分析和数据挖掘相当有利。合理运用数据挖掘工具和方法,可以提升商业银行的核心竞争力,最终实现商业银行的跨越式发展。论文网
数据挖掘不同于一般的管理软件,编好了拿来用就是了,数据挖掘在行业的应用也是一种创新。其实在数据挖掘算法方面国内的研究团队已经取得了一系列国际水平的研究成果,但是应用方面和国外发达国家相比差距较大,应用广度和深度都远远不够,但愿通过我的努力,推动数据挖掘在商业银行私人银行业务中的具体应用,为建设创新型国家略尽绵薄之力。
1.2 数据挖掘的基本理论
数据挖掘(Data Mining,DM)又名数据库中的知识发现(Knowledge Discover in Database,KDD),是目前数据库研究领域和人工智能领域的热点问题,数据挖掘就是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、模式识别、统计学、数据库、机器学习、可视化应用等,高度智能化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的有用模式,协助决策者调整市场战略和策略,降低风险,从而做出正确的决策。