低 小型 中等 好
高 标准型 高 好
3。3。1 未处理的决策信息表
(1)决策规则
规则1:价格低并且是标准型规格并且里程数高,则我们人为这辆汽车的性能好;
规则2:价格高并且是标准型规格并且里程数中等,则我们人为这辆汽车的性能好;
规则3:价格低并且是标准型规格并且里程数低,则我们人为这辆汽车的性能差;
规则4:价格低并且是小型规格并且里程数中等,则我们人为这辆汽车的性能差;
规则5:价格高并且是标准型规格并且里程数低,则我们人为这辆汽车的性能差;
规则6:价格高并且是标准型规格并且里程数高,则我们人为这辆汽车的性能好。
(2)近似精度
我们可以根据基本概念中近似精度的定义及公式计算条件属性集对决策属性集的近似精度:
由于近似精度表达的是决策属性集对于条件属性集依赖程度的一个衡量,即通过条件属性对决策表的对象进行划分得到一个条件类,通过决策属性对论域划分得到一个决策类,我们把条件类中能被肯定的划分到决策类中的对象占论域全部对象的百分比称为条件属性集对决策属性集的近似精度。文献综述
(3)属性重要度
属性重要度其实是根据前面我们所计算的近似分类质量得到的,它的基本思路是如果从条件属性集中删除某个属性,再观察除去这个属性后条件属性对决策属性的错误分类是否产生了变化,如果发生了变化,是变大了还是变小了,从而判断这个属性对于条件属性集的重要程度。由
因此我们根据属性重要度的公式:
且从而有
从上面的属性重要度可以看出,从条件属性集中删除了属性后,条件属性对决策属性错误分类的比率是;从条件属性集中删除了属性后,条件属性对决策属性错误分类的比率是,说明属性对于条件属性集是完全没有必要的,这与我们前面约简后所得到的结果是一致的;从条件属性集中删除了属性后,条件属性对决策属性错误分类的比率是,这说明删除属性后,条件属性对决策属性错误分类的比率达到了,非常之高,因此在条件属性集中最重要的属性是,接下来是属性。而属性则是不重要的,甚至完全没有必要的属性。
3。3。2 规则获取
(1)约简
由上面的约简我们可以知道条件属性集中的是不必要的。而是必要的,因此条件属性集相对于决策属性集的约简为,由于只有一个属性约简,因此条件属性集的核也是,即汽车的价格和里程数是反映汽车性能的关键指标。我们得到的约简后的决策信息表为来自~优尔、论文|网www.youerw.com +QQ752018766-
表3-2约简后的决策信息表
价格 里程数 性能
低 高 好
高 中等 好
低 高 差
低 低 差
低 中等 差
高