关联规则及其算法比较(2)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

关联规则及其算法比较(2)

6

2。2 关联规则的分类 7

第3章 Apriori的算法 8

3。1 Apriori算法的介绍 8

    3。2  Aprior算法几种改进方法 9

第4章 TDA(Two dimensional array)算法 10

4。1 TDA存储结构 10

4。2 TDA挖掘算法 11

4。3 TDA算法的优缺点 12

第5章  Apriori与TDA的效率比较 13

第6章 总结与展望 15

参考文献 16

致谢 16

第1章 绪论

1。1 引言

当今世界,由于计算机技术的快速发展,信息产业迎来了空前的繁荣与兴旺。随着数据库存储容量的增大,数据存储变得更加方便,导致数据的急速增加。但是我们并没有有效的数据分析的工具去分析大量的数据,导致我们空有大量的数据,却没有充分地利用,只能将其束之高阁。极速增长的海量数据,若没有强大的分析工具,想理解并利用它们不是一件容易的事情。最后,通过各种方式耗费人大量精力收集的数据只能变成难得再次访问的数据档案。因此,人类非常迫切的需要一种能够从海量数据库中找到有效信息的工具,来解决眼前的烦恼。数据挖掘技术就是在这种背景下产生的。

我们所发现的知识的好坏受到数据挖掘算法优劣的制约。到 目 前 为 止,数 据 挖 掘 大 多 数 都 集 中 在 算 法 和应 用 的 研 究 上。并且数据挖掘的关联规则算法已经成功的运用到了商业领域中,取得了一定的成就,这使其越来越火热。

1。2课题的研究背景及意义

数 据 挖 掘 是 一 门 能 够 把 数 据 转 换 成 有 用 信 息 的 技 术,它 不 但 可 以 帮 人 们 从 数 据 库 提 取 出 感 兴 趣 的 知 识 及 信 息,而 且 也 可 以 帮 助 人 们 在 不 同 角度 上 分 析 它 们,能 够 对 数 据 进 行 更 加 有 效 地 利 用。它 不 仅 能 够 用 于 表 达 过去 数 据 的 发 展 过 程,而 且 还 能 进 一 步 对 未 来 的 发 展 趋 势 进 行 预 测。所 以,数 据 挖 掘 近 年 来 越  来 越 重 视,正 在 成 为 一 个 崭 新 的 热 点 研 究 领 域。文献综述

而关联规则算法是数据挖掘中非常重要的一环,是知识发现技术研究的重要内容。由于数据的急速增加,越来越多的人投入关联规则的算法中来。在关联规则算法中,Apriori算法是非常经典的一个算法,其余太多数算法都是它的变体或扩展。因为Apriori算法存在挖掘效率低,占用空间大等缺陷,使越来越多的人加入到改进Apriori算法的队伍中来。

   本课题主要是通过对关联规则及其相关算法的研究,使TDA关联规则挖掘算法较好地改善了Apriori类算法的不足,让频繁项集的挖掘效率得到了提高。

1。3国内外研究现状

第2章 关联规则

2。1 关联规则的定义 

设I={ ,…,  }是由m个不同 的 项 目 组 成 的 集合,而与任 务有关的数据D是数据库事务的集合,并且其中每个事务都是项的集合,使得T ⊆I。事务数据库D={ ,…, }是由一系列具有惟一标识TID的事务组成。设A 是 一 个 项 集,事务 T包 含A,当且仅当A⊆T。

定义1  假设项目集A是I中项目的集合,如果A包含k个项目,那么A称为k一项集[11]。 (责任编辑:qin)