定义2。1[2] 设为一个论域,,对于任意, 基于等价关系的下近似和上近似的定义分别如下:
其中,它表示元素在论域上的有等价关划分的等价类。而的正域、负域以及边界域的集合我们可以根据上近似和下近似的定义得到,它们分别是
其中关于的正域表示由当前的知识我们可以断定属于的元素而组成的集合;关于的负域表示由当前的知识我们可以断定不属于的对象而组成的集合;而关于的边界域则表示我们根据当前所具有的知识可以判断出肯定属于但是又不能够确定一定属于的对象所组成的集合。
2。1。2 决策信息系统
定义2。2[4]设是一个四元组,其中为论域,是非空有限属性集合,而对于表示的是属性的值域;表示的是由全体属性的值域所组成的集合,即; 我们用表示的是一个信息函数,对于我们定义表示的是在属性上的取值,即。则我们把称为一个信息系统,如果而且,其中表示的是条件属性集合即条件属性集,表示的是决策属性集合即决策属性集,之前的信息系统又可以被称为决策信息系统。
2。1。3 近似精度
定义2。3[5]设是一个论域,,对于任意的的近似分类精度为
(2-6)
其中表示的是集合的基数,它所描述的是我们所能够了解集合的完全程度。而的近似精度为
(2-7)
近似精度描述的是在条件属性集下能准确的划入决策类的对象占全体对象的百分比,反映了决策属性集对条件属性集的依赖程度。
2。1。4 不可分辨关系
定义2。4[6] 设是一个信息系统,对于任意的,定义上的不可分辨关系为
(2-8)
二元不可分辨关系是上的一个等价关系,我们把在上的一个划分记为,对于任意的,我们把的等价类记为是,等价类也叫知识颗粒,并且有。
2。1。5 约简
定义2。5 设是一个决策信息系统,对于任意的,决策属性集关于条件属性子集的正域为
(2-9)
定义2。6设是一个决策信息系统,如果有
(2-10)
则我们认为为中相对于是可以省略的,否则是不可以省略的。
定义2。7[7]设是一个决策信息系统,设是的一个非空的子集,且满足
(1),是中不能省略的属性;
(2)
那么条件属性集的一个约简就是,而的所有约简的集合记为,而表示条件属性集的核,它是条件属性集所有约简的交集,记作。属性的核是约简条件属性集中的最重要的部分,它也可以是空集。
定义2。8设是一个决策信息系统,是决策属性集对的一个划分,相对于的属性重要度为
(2-7)
通过上面有关约简和属性的定义我们可以知道,属性的重要度表达了在条件属性集中,属性所占的地位,如果属性的重要度是0,那么我们就认为此属性是属性集中不必要的属性,则在约简的过程中会将此属性相应的约去,反之,属性重要度大的属性,说明它是必要的属性,最后保留在约简的属性集当中。