18
4。4。1未处理的决策表 19
4。4。2 规则获取 21
结论 27
致谢 28
参考文献 29
第一章 绪论
1。1 研究背景和意义
粗糙集理论作为一种数据分析处理的理论,它是由波兰科学家Z。Pawlak[1]首先提出来的。后来全国各地的学者积极的研究并且对其进行广泛地应用。随着数据量的不断增长,我们要想从这些浩瀚的数据里获得所需要或研究的数据,就需要一种针对性的方法来对这些数据进行去粗取精,基于粗糙集理论,设计并实现知识获取和约简方法,对影响决策的多个要素进行分析,获取决策规则,从而获得我们所需要的知识,数据挖掘就是我们所说的知识获取,它是从海量的不完整而且又模糊的、带有随机性的数据集中发现潜藏在表象之下、不容易被人们发现、但又具有一定价值的信息。被提取出来的知识可以表示为概念、规律、模式或者是规则等形式。在知识获取的过程中,人们既要面对巨大容量的数据,同时也可能面临数据质量差的问题,即面对的是大量的不确定信息,而处理不确定的信息虽然有很多种方法,如模糊集理论, 概率统计方法等。但是这些方法不仅需要数据集,还需要一些数据集以外的附加信息,比如在模糊集理论的数据分析方法中需要隶属函数,而在概率统计的相关数据分析方法中需要数据集的概率分布函数等。但是在一些错综复杂又不完整的大容量数据中,要想准确地确定隶属函数或概率分布对人们来说是一个很大的难题。因此,在当前的大数据时代,人类对信息的完整、全面越难以把握的条件下,粗糙集理论作为一种可以客观有效地处理不完整、不确定性信息的强大数学工具对于信息的挖掘有着巨大的应用价值。但是单粒度下的经典粗糙集模型只有一个条件属性集,即只有一族等价关系,而且对于约简的决策数据表要求较为严格。为此,我国著名的教授钱宇华首次提出了粗糙集中多粒度的概念,对于现在复杂多变的信息的处理分析具有重要而且有效的作用。从而,研究基于粗糙集理论的决策规则的获取和知识约简的一般方法,并将其推广到多粒度粗糙集模型下的决策规则获取和约简,是一个非常具有现实应用价值的课题。
1。2 研究现状
1。3 论文主要工作
通过查阅资料以及向老师请教,主要完成了如下内容:
(1)粗糙集理论的基本理论概念
(2)经典单粒度粗糙集的约简与决策规则的获取方法
(3)将单粒度的决策规则获取方法向多粒度推广
(4)结论
第二章 粗糙集理论简述
2。1 基本概念
设是全体对象组成的一个有限集合,则称为论域。对∀一个中的子集 , 称为中的一个概念[3]。而我们把中的任何一个概念称作是的抽象知识,我们把它简称为知识。假设是由上的一簇等价关系所决定的一个集合,我们则把知识基用来表示。 对∀,上的一个近似空间用来表示。对∀, 若,我们在近似空间中把对象 与称为是不可分辨的。 通过离散数学的知识有: 上的一个二元等价关系跟上的一个划分是相互对应的,因此如果我们假设由二元等价关系所导出的一个关于论域的划分用表示,则中的元素被称作基本集或原子集。而近似空间中的对∀,若是由一些基本集组成的并集,则称是上可定义的,反之是不可定义的。
2。1。1 上近似、下近似 基于粗糙集理论的决策规则获取方法研究(2):http://www.youerw.com/shuxue/lunwen_107336.html