(2)关联规则基本概念
设I={i1,i2,im}是项的集合。设任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合,使得 。每个事务有一个标识符,称作TID。设A是一个项集,事务T包含A当且仅当 。关联规则是诸如A B的蕴涵式,其中 , ,并且 。
(3)支持度与置信度
规则的支持度和置信度是两个规则兴趣度量值,它们分别表示发现规则的有用性和确定性。规则A B在事务级中D中成立,具有支持度s,其中s是D中事务包含 (即A和B二者)的百分比,它是概率 。规则A B在事务集中具有置信度c,其中D中包含A的事务同时也包含B的百分比是c。这是条件概率 。即是 数据挖掘在教学评价中的应用研究(4):http://www.youerw.com/jisuanji/lunwen_5694.html