2.3 数据挖掘的主要方法与问题

 (1)分类

   即通过分析数据特点且按照一定规律对其进行划分。

(2)回归分析

    回归分析方法反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系。

(3)聚类

   类似于分类,但将得到的数据按照相似性与差异性进行划分后,要尽可能地保证同组内数据相似度尽可能的高以及不同组数据相似度的低。

(4) 关联规则

   关联规则是描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。

(5) 特征

   即将一组数据的所具有的特性归纳总结并提取出来,得到相应的特征式。

(6)变化和偏差分析

偏差分析是为了寻找观察结果与参照量之间有意义的差别。包括一些潜在有趣的知识,如分类中的反常实例,模式的例外,观察结果对期望的偏差等。

上一篇:数学文化对中学数学教育的影响
下一篇:对称性在积分计算中的应用

基于决策树算法的篮球联赛预测

多元回归模型杭州市生产总值及其影响因素

线性回归模型在预测杭州CPI中的应用

汽车油耗数据的相关分析与回归分析

基于回归分析研究周口市...

正交变换的分类及性质

基于多元回归分析模型的研究

国内外图像分割技术研究现状

承德市事业单位档案管理...

10万元能开儿童乐园吗,我...

中国学术生态细节考察《...

公寓空调设计任务书

志愿者活动的调查问卷表

神经外科重症监护病房患...

AT89C52单片机的超声波测距...

医院财务风险因素分析及管理措施【2367字】

C#学校科研管理系统的设计