近年来,随着医疗、互联网等行业的不断发展,研究技术的不断深入和应用领域的需求的复杂化,关联规则算法也有很多的研究扩展方向:
(1)经典的布尔关联规则的优化
基于经典Apriori算法,人们提出了很多改进缺点的算法。基于Hash表的项集计数技术;基于事务压缩的算法;基于划分的算法;基于抽样技术的算法;基于动态项集计数的算法;并行算法;分布式算法;增量算法等;86910
(2)多维和多层的关联规则的研究
多层关联规则:因为抽象程度的不同,数据的概念有不同的抽象层次。在关联规则挖掘算法中引入多层次的数据,就是多层关联规则。
多维关联规则:大多数的关联规则都是单维的,仅仅涉及数据集中一个维度或者属性。若涉及数据集中多个维度或者属性,那么挖掘的就是多维关联规则。
(3)基于频繁项集的规则挖掘论文网
关联规则挖掘一般包括两个子问题:①基于支持度,产生频繁项集;②基于可信度,产生强关联规则。大部分的研究内容都是针对第一步,即生成频繁项集的步骤。第二步的研究则较少,所以,有许多的学者对产生强关联规则提出了一些算法,例如关联规则聚类、基于概念格的算法、针对实际问题(如隐私保护等)提出的规则提取算法。
(4)关联规则的增量更新算法
当数据库中的数据量变化,或者支持度、置信度需要调整的时候,如何利用已经得到的挖掘成果来高效地挖掘现在所需要的关联规则,就变成了一个很重要的问题,所以增量更新算法的研究拥有很强的实际意义。
(5)特殊模式类型的关联规则
负关联规则所描述的是项集之间的互斥关系,和传统关联规则不同,负关联规
则研究内容一般都是类似“80%的客户在购买咖啡的时候不会购买茶叶”的问题。
时态关联规则就是附加某种时态约束的规则。与在一般的事务数据库中进行的关联规则挖掘对比起来,时态关联规则可以更好地反映数据集中隐藏的和时间有关的知识、信息。
加权关联规则挖掘,主要思想就是区别对待数据库中的不同项目的重要性,给予不同项目不同的权重,挖掘出不同重要性的规则。
约束关联规则的挖掘,就是加强人对数据挖掘过程的导向和控制,以此提高数据挖掘的性能和效率,避免挖掘出大量用户不感兴趣的规则。