粗糙集中属性约简定义和算法研究(3)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

粗糙集中属性约简定义和算法研究(3)


从知识库的观点看,每个等价类被称为一个概念,即一条知识(规则)。即,每个等价类唯一地表示了一个概念,属于一个等价类的不同对象对该概念是不可区分的。
2.1.2  知识表达系统
一个知识表达系统或信息系统S可以表示为有序四元组S={U,A,V,f}
其中,U={x1,x2,,xn}为论域,它是全体样本的集合;
A=C∪D 为属性集合,其中子集C是条件属性集,反映对象的特征,D为决策属性集,反映对象的类别;
         为属性值的集合,Va表示属性a的取值范围;
f:U×R→V 为一个信息函数,用于确定U中每一个对象x的属性值,即任一x∊U,a∊A,则f(x,a)=Va。

2.1.3  不可分辨关系
正如引言中所述,粗糙集理论的出发点是不可分辨关系通过对感兴趣的对象信息生成的。 不可分辨关系是为了表达一个事实,即由于缺乏知识,我们无法采用现有的信息分辨有些对象。这意着,在一般情况下,我们无法处理单个对象,但我们要考虑集群无形的对象,作为我们理论的基本概念。
现在我们更精确地提出上述表达。
假设我们给出两个有限非空集U和A,其中U是全集,A是属性集。随着每一个属性aA我们关联另一个集Va,它的值称为a的一个域。在U上确定的任何一个A的子集B的二元关系(I(B) on U)将被称为不可分辨关系,并定义如下:
当且仅当对每一个aA, a(x) = a(y)都成立,则xI(B)y成立。
此处a(x)表示元素x的a属性之值。
显然地,I(B)是一个等价关系。所有I(B)等价类的族(即根据B的分区)记作U/I(B)或简单的U/B。单个I(B)的等价类(即包含x的分区U/B的一个块)记作B(x)。
若(x, y)属于I(B),我们说x与y在B上不可分辨。关系I(B)的等价类(或分区U/B的一个块)被称为B基本集。
不可分辨关系这一概念在RS中十分重要,它反映了我们对世界观察的不精确性。
不可分辨关系反映了论域知识的“颗粒性”。知识库中的知识越多,知识的颗粒度就越小,随着新知识不断加入到知识库中,粒度会不断减小,直致将每个对象区分开来。但知识库中的知识粒度越小,则导致信息量增大,存储知识库的费用越高。 (责任编辑:qin)