粗糙集中属性约简定义和算法研究(2)
时间:2018-05-30 14:48 来源:毕业论文 作者:毕业论文 点击:次
我国对于RS理论的研究虽然起步较晚,但发展迅速并伴随取得了丰富成果。2001年五月,“第一届中国粗糙集与软计算学术研讨会”在重庆邮电大学举办;2003年,中国人工智能学会RS与软计算专业委员会成立,吸引了国内众多高校与科研机构的学者进入这一新兴的研究领域。目前,国内已经形成了一支较稳定的RS理论研究学术队伍,中国学者在国际RS理论领域的影响力也日益扩大,正逐步成为这一“朝阳领域”的重要科研力量。 RS的研究对象是由一个多值属性集描述的一个对象集。就每一个对象与其对应属性,都会有一个值作为其描述符号(对象、属性与描述符号三者共同构成了表达决策问题的三个基本要素)。这种表达形式通常可以看作一个二文表,表的行与对象对应,列与对象的属性对应,如此每一行就阐释了各对象的描述符以及它们类别成员的信息。一般地,关于对象的先验信息不一定能作为划分其成员类别的依据——也就是说这种普遍存在的不精确性导致了对象的不可分辨性。 RS作为一种直接处理信息的数学方法,特点在于无需任何先验信息,直接对数据间隐藏关系进行研究而揭示潜在规律,以此达到提取有用信息的目的。它直观反映了人们使用不完备的信息(知识)去处理模糊现象的能力,或依靠观察、度量得到的某些不确定结果而进行数据分类的能力。这种对常识的亲和性令研究者们很早就开始致力于将RS理论平滑过渡到应用阶段,目前成果比较出众的几个领域有医疗诊断、文本分类、金融数据分析、地震预报、客户行为分析、入侵检测等。而在这一系列的应用开发过程中,人们逐渐意识到了一个交叉点:知识获取。 知识获取领域知名学者Fayyad对知识获取的定义是:知识获取是识别出存在于数据库中有效的、新颖的、具有潜在效用的乃至最终可以理解的模式的非平凡过程。由于知识获取是一门应用导向的学科,学科交叉纷繁复杂,因此不同学科背景下对知识获取的定义会有所差异。如智能信息分析、信息提取以及数据挖掘等实质上阐述的都是知识获取的概念。 知识获取的应用范围广泛(经济、商业、军事、科研等)而且方法众多(机器学习、模式识别、概率统计等),然而这些方法大多需要一定的先验或者附加知识,在实际应用中经常因为条件不完备而导致获取的结果无法达到预期。 RS理论支持知识获取的多个过程,例如数据预处理、数据约简、规则生成、数据依赖关系获取等。然而与以往方法不同的是RS理论对模糊、不完备知识的处理相当出色,因此成为了当代知识获取研究中的一大有力工具。当代世界范围内的众多学者对知识获取中的数据约简进行了深入探索,提出了众多约简算法。 目前,RS领域的研究主要集中在优化约简算法效率、RS理论与模糊理论、RS理论与神经网络理论等其它人工智能技术的结合、粗糙逻辑学等课题上。本文对于RS理论框架下属性约简算法的研究是对当下RS领域中热门课题的一个探索。 2 粗糙集基础知识 2.1 粗糙集基本概念 2.1.1 知识与分类 在粗糙集理论中,知识被认为是一种分类能力。人们的行为基本是分辨现实的或抽象的对象的能力。 假定我们起初对论域内的对象(或称元素、样本、个体)已具有必要的信息或知识,通过这些知识能够将其划分到不同的类别。若我们对两个对象具有相同的信息,则它们是不可区分的,即根据已有的信息不能将其划分开。 粗糙集理论的核心是等价关系,通常用等价关系替代分类,根据这个等价关系划分样本集合为等价类。 (责任编辑:qin) |