现实生活中有许多含糊现象并不能简单地用真、假值来表示,如何表示和处理这些现象就成为一个研究领域。早在1904年谓词逻辑的创始人G.Frege就提出了含糊(Vague)一词,他把它归结到边界线上,也就是说在全域上存在一些个体既不能在其某个子集上分类,也不能在该子集的补集上分类。粗糙集理论是由波兰科学院Z.Pawlak院士于1982年在文[1]中首先提出的,其视论域的划分为知识并进行刻画及研究规则提取、知识约简等,是一种新的数据分析与推理的数学理论。粗糙集理论提供了案例约简的一种数学方法。由于这一理论的广泛应用,它越来越引起国际学术界的关注。
目前,粗糙集理论在信息科学、医药科学、工程技术、金融商业、环境科学、社会科学等领域中得到了广泛的、较为成功的应用,并且越来越受到其它更多领域的重视。基于这样的背景下,本文旨在通过对粗糙集理论的认识和研究,为决策过程的简化提供工具和方法,并证明粗糙集在实际生活中的适用性。
1.1.1粗糙集理论研究现状
1.1.2 粗糙集理论在案例检索中的应用
随着社会的发展,现代知识结构变得越来越复杂,所包含的属性越来越多,尤其是大型机械设备所实现的功能越来越强大,包含的部件越来越多,这些都使得作为知识表达的案例表示越来越复杂,包含的属性越来越多。属性的增多无疑增加了计算机处理系统的处理难度,尤其是当案例库中案例变得很庞大时,案例推理(CBR)[26]中检索的速度将受到极大的影响,而案例库中案例的丰富与否又直接影响着案例检索的结果,因此维护一定数量的案例集是案例推理系统中所必须的。因此如何从高维数据中剔除其中冗余的、不重要的属性,即如何简化知识系统就成为解决该难题的一个方向。
粗糙集理论不仅为信息科学提供了新的研究理论,也为智能信息处理提供了有效的解决办法。从粗糙集理论的核心内容之一——属性约简——可以保持决策系统分类能力不变的情况下,删除其中不相关或者不重要的属性列,从而简化案例库中属性的维度,简化案例集的知识表示,提高计算机对案例集的处理能力;同时属性约简可以从案例库中提取一些关键属性信息,获得一些重要的规则知识,可以用于机器学习和数据挖掘领域。简单来讲,粗糙集理论的主要特点如下:
(1)粗糙集理论仅利用数据本身提供的信息,无须任何先验知识。
(2)粗糙集理论是一个强大的数据分析工具。它能表达和处理不完备信息;能在保留关键信息的前提下对数据进行约简并求得知识的最小表达;能识别并评估数据之间的依赖关系,揭示出概念简单的模式;能从经验数据中获取易于证实的规则知识。
1.2 本文主要研究内容
粗糙集理论(Rough Set Theory,简称RST)是一种新型的处理不确定性知识的工具,它的最大特点是只需要提供所需处理的数据集合,不需要任何其他先验知识。是由波兰科学家Pawlak教授所提出的对不完整数据进行分析、推理、学习、发现的新方法[2]。目前RS理论已成为人工智能领域中一个较新的学术热点,引起越来越多科研人员的关注,并在许多科学领域和工程领域得到成功应用。
本文首先研究了粗糙集的基础理论知识,讨论了粗糙集的产生背景、定义及粗糙集中有关知识分类、信息系统定义、属性约简等内容;其次探讨了变精度粗糙集模型,决策表约简中的四种属性约简算法和四种属性值约简算法。现今,大部分决策问题都可以通过决策表形式地表达出来,因此它在工程应用中越来越重要。 变精度粗糙集的案例约简方法研(3):http://www.youerw.com/guanli/lunwen_70291.html