数据挖掘技术在个人信用评估模型中的应用 第2页
数据挖掘开始是面向商业领域的应用技术,最早在零售业和金融业等领域。数据挖掘的目标就是从大量的商业数据,发现隐藏的、有价值的知识和信息,从而指导商业活动和商业决策,提高企业的核心竞争力。数据挖掘的功能主要包括:
(1)关联分析:包括简单关联、时序关联和因果关联等,指分析数据之间的内在联系,揭示事件或实体之间的依赖性和相关性。典型应用是货篮子分析,发现关联规则来指导产品的货架存放和交叉销售。
(2)分类分析:指根据一定的规则,将每个组和实体根据分类信息准确地进行归类。不同的实体具有不同的性质和特征,这是将实体划分成不同类别的依据。将大量的数据系统化 和条理化,从而建立数据的分类规则和模型,对其他的数本文来自优文论文网据进行分类。具体方法有决策树、统计分析、神经网络和粗糙集等。
(3)聚类分析:指具有相同特征的实体聚合成为一个类,并用一定的规则来 描述该类的共同属性。与分类分析不同的是,数据记录在事先没有确定类别归属,而是通过归纳数据之间的特征和差异,形成聚类规则。常用于寻找新客户、市场销售、市场分割等方面。
(4)偏差分析:描述和分析数据的异常或极端现象,包括不规则数据、反常实例和观测结果与期望值的偏离等。主要用于分析客户异常行为、信用欺诈甄别和数据质量控制,以及网络安全管理和故障检测等领域。
(5)预测与评价:通过历史数据的综合分析,找出数据分布的规律性,对未来的趋势进行预测和评估。用于预测事件未来发生的概率,商业收益性评价和客户信誉度评价,股票走势分析和市场动态预测等。
4 数据挖掘在个人信用评估中的应用
在发达国家,数据技术和基于知识管理技术的数据技术已经很快和广泛地应用于信用评估和信用评分等领域。
4.1 在信用评估中的应用
数据挖掘从大量数据中提取或“挖掘”知识,其任务可以分为描述和预测两类。
4.2 在信用计分模型构建中的应用
信用评分是最早开发的金融风险管理工具之一。20世纪50年代,美国零售商和邮购商对信用评分的应用,与资产组合分析工具在管理和分散投资风险中的早期应用,在时间上相吻合。同时,信用评分也可以说是数据挖掘技术的前辈,因为它是消费者行为数据最早的应用之一。实际上,目前数据挖掘中最常用的技术,包括分组、倾向模型和聚类等,在信用评分中都得到了成功的运用。利用数据挖掘技术构建信用计分模型一般可以分为8个步骤,分别是:业务目标确定、数据源确定、数据收集和筛选、数据挖掘、模型确定、模型检验、模型应用和模型调整。
(1) 业务目标确定:确定项目的目的是构建信用卡的申请计分卡还是行为计分卡。
(2) 数据源确定:主要内容是分析和了解所有可能使用的数据源,确定哪些数据源可以提供更加准确详细的信息。构建信用计分模型所需要的是关于客户的大量信息,应该尽量收集全面的信息。所需要的数据可能是业务数据,可能是数毕业论文
http://www.youerw.com一步骤确定的数据源中收集一定数量的数据并进行筛选,为挖掘准备数据。在筛选数据过程中一定要注意数据样本的大小和质量,还要注意保证数据的任意性,好坏数据比例一般要达到1:1。在样本数量能够得到保证的前提下,将样本一分为二,一部分用来进行数据挖掘,另一部分封存,待模型确定以后进行模型检验。
(4) 数据挖掘:使用第一组数据进行模型分析和数据挖掘。挖掘数据是所有数据挖掘项目中最核心的部分。在时间或其它相关条件(诸如软件等)允许的情况下,最好能够尝试多种不同的挖掘技巧。因为使用越多的数据挖掘技巧,可
上一页 [1] [2] [3] 下一页
数据挖掘技术在个人信用评估模型中的应用 第2页下载如图片无法显示或论文不完整,请联系qq752018766