关联规则算法的研究现状与发展前景_毕业论文

毕业论文移动版

毕业论文 > 研究现状 >

关联规则算法的研究现状与发展前景

近年来,随着医疗、互联网等行业的不断发展,研究技术的不断深入和应用领域的需求的复杂化,关联规则算法也有很多的研究扩展方向:

(1)经典的布尔关联规则的优化

基于经典Apriori算法,人们提出了很多改进缺点的算法。基于Hash表的项集计数技术;基于事务压缩的算法;基于划分的算法;基于抽样技术的算法;基于动态项集计数的算法;并行算法;分布式算法;增量算法等;86910

(2)多维和多层的关联规则的研究

    多层关联规则:因为抽象程度的不同,数据的概念有不同的抽象层次。在关联规则挖掘算法中引入多层次的数据,就是多层关联规则。

多维关联规则:大多数的关联规则都是单维的,仅仅涉及数据集中一个维度或者属性。若涉及数据集中多个维度或者属性,那么挖掘的就是多维关联规则。

(3)基于频繁项集的规则挖掘论文网

关联规则挖掘一般包括两个子问题:①基于支持度,产生频繁项集;②基于可信度,产生强关联规则。大部分的研究内容都是针对第一步,即生成频繁项集的步骤。第二步的研究则较少,所以,有许多的学者对产生强关联规则提出了一些算法,例如关联规则聚类、基于概念格的算法、针对实际问题(如隐私保护等)提出的规则提取算法。

(4)关联规则的增量更新算法

    当数据库中的数据量变化,或者支持度、置信度需要调整的时候,如何利用已经得到的挖掘成果来高效地挖掘现在所需要的关联规则,就变成了一个很重要的问题,所以增量更新算法的研究拥有很强的实际意义。

(5)特殊模式类型的关联规则

负关联规则所描述的是项集之间的互斥关系,和传统关联规则不同,负关联规

则研究内容一般都是类似“80%的客户在购买咖啡的时候不会购买茶叶”的问题。

时态关联规则就是附加某种时态约束的规则。与在一般的事务数据库中进行的关联规则挖掘对比起来,时态关联规则可以更好地反映数据集中隐藏的和时间有关的知识、信息。

加权关联规则挖掘,主要思想就是区别对待数据库中的不同项目的重要性,给予不同项目不同的权重,挖掘出不同重要性的规则。

约束关联规则的挖掘,就是加强人对数据挖掘过程的导向和控制,以此提高数据挖掘的性能和效率,避免挖掘出大量用户不感兴趣的规则。

(责任编辑:qin)