数据挖掘在教学评价中的应用研究(4)
时间:2017-04-25 19:25 来源:毕业论文 作者:毕业论文 点击:次
(2)关联规则基本概念 设I={i1,i2,im}是项的集合。设任务相关的数据D是数据库事务的集合,其中每个事务T是项的集合,使得 。每个事务有一个标识符,称作TID。设A是一个项集,事务T包含A当且仅当 。关联规则是诸如A B的蕴涵式,其中 , ,并且 。 (3)支持度与置信度 规则的支持度和置信度是两个规则兴趣度量值,它们分别表示发现规则的有用性和确定性。规则A B在事务级中D中成立,具有支持度s,其中s是D中事务包含 (即A和B二者)的百分比,它是概率 。规则A B在事务集中具有置信度c,其中D中包含A的事务同时也包含B的百分比是c。这是条件概率 。即是 (责任编辑:qin) |