摘要:随着数据库技术和信息技术的飞速发展,从大量的数据中获取有用的信息和知识变得越来越重要。模糊关联规则挖掘是数据挖掘中针对数量型属性关联规则发现的一种有效方法。本文采用数据挖掘和关联规则作为知识发现的基本结构,研究了模糊关联规则挖掘算法。针对原有关联算法只能挖掘布尔型关联规则的问题,本文结合模糊集理论,把模糊关联规则应用于网络中杂乱、繁复的安全事件分析中。通过对DARPA标准数据集的分析,得到了预期数量的关联规则,某些场景仿真表明取得了较好的实验结果。5526
关键词:数据挖掘;关联规则;模糊关联规则;网络安全
Application Research of Fuzzy Association Rules
Abstract: With the rapid development of database technology and information technology, it is becoming increasingly important to obtain useful information and knowledge from large amounts of data . Fuzzy association rule mining is an effective method for quantitative attributes in data mining association rules. In this paper, it took the data mining and association rules as the basic structure of knowledge discovery, studied the fuzzy association rule mining algorithm . In view of the existing correlation algorithm can only solve the problem of mining Boolean association rules, based on the fuzzy set theory, this paper applied the fuzzy association rules to the heavy and complicated security incidents analysis in the network, .This paper obtained the anticipated number of association rules through the analysis of the DARPA standard data sets and some scene simulation indicated that good experimental results were obtained.
Key Word:Data Mining; Association Rules; Fuzzy Association Rules; Network Security
目 录
摘要 1
引言 1
1.数据挖掘 2
1.1数据挖掘的概念 2
1.2数据挖掘的特点 2
1.3数据挖掘的步骤 2
2.关联规则 3
2.1关联规则概念 3
2.2关联规则的几个度量值 3
2.3关联规则挖掘步骤 5
2.4关联规则算法Apriori 5
3.模糊关联规则及相关概念 8
3.1模糊关联规则理论基础 8
3.2模糊关系 10
4.模糊关联规则挖掘算法在安全事件相关应用 12
5.结论及展望 14
参考文献 15
致谢 16
模糊关联规则及其应用研究
引言
自从Agrawal等提出了挖掘顾客交易数据库中项集间的干练规则问题之后,数据库中关联规则的挖掘一直是人们研究的重点,因为它可以发现数据库(特别是大规模数据库)中未知而有用的模式,支持人们的决策,从而带来巨大的、直接的社会、经济效益。对关联规则的研究有单层次关联规则,多层次关联规则。随着电子技术、计算机技术、通信技术等先进技术的引入,社会的信息化建设不断增强,各行业每天都会采集到海量的业务数据,包括各类的设计数据、生产监控数据等。在过程控制系统中,想要充分利用这些数据,就必须在庞大的数据库中找出对改善控制系统有用的数据,这就使数据挖掘(Data Mining)技术成为可能,并根据关联规则找出与之相关的数据之间的关系,然后根据挖掘出的数据分析、发现过程控制系统中所存在的问题并及时解决问题。
1.数据挖掘
1.1数据挖掘的概念
数据挖掘(Data Mining)的概念有多种描述,最常见的有两种:(1)G.Piatetsky Shapior,W.J.Frawley数据挖掘定义为:从数据库的大量数据中揭示出隐含的、先进而未知的、潜在且有用信息的频繁过程。这个定义有几层含义:数据源必须是确实存在的、数量巨大的、含噪声的;发现的是用户感兴趣的信息或知识;这些内容要能够被接受、能够被理解、能够被运用;并没有要求发现对任何问题都适用的知识,但要支持特定的发现问题。和数据挖掘具有相同含义的词有决策支持、数据融合和数据分析等。(2)数据挖掘的广义观点:数据挖掘是从存放在数据库或其他信息库中的大量数据中发现有趣知识的过程[1]。 模糊关联规则及其应用研究:http://www.youerw.com/zidonghua/lunwen_2587.html