(2) 粗糙集理论的属性约简研究
从理论与应用的视角来考虑,属性约简是粗糙集方法研究的核心问题之一。众所周知,在数据集中,每个属性(特征)的重要性程度是不尽相同的,因而所谓属性约简,就是考虑在一些度量标准的前提条件下(如近似质量、熵、近似分布),选择出数据集中重要的属性并剔除冗余属性。经历了三十余年的发展,目前粗糙集理论中常用的属性约简算法大致可归为2类:穷举算法与启发式算法。尽管穷举法可以求得信息系统的所有约简,如分辨矩阵方法及回溯方法皆属于穷举法范畴,但是由于其计算过程过于复杂,并不适合大尺度复杂数据的约简;利用贪心策略设计的启发式算法虽然仅能求得数据集的一个约简,但由于其求解的时间效率较高而备受青睐。
1 研究基于贪心策略的启发式属性约简算法。继而挑选出重要度较大的属性,以达到精简数据规模的目的。
2 将代价的概念引入决策粗糙集模型,进行传统的启发式属性约简算法,并将其与基于遗传算法的启发式属性约简算法进行对比实验。体现新算法的优异性。
3 将样本选择的思想引入决策粗糙集模型,采用先聚类后样本的选择的思想先对原数据集进行横向筛选,再利用传统的启发式属性约简算法对样本选择后的信息系统进行约简,以达到大大缩减数据规模的目的。
1 研究和构建经典粗糙集模型。
2 研究和实现传统的基于启发式的属性约简算法。
3 研究和实现基于遗传式的模糊集属性约简算法。
4 研究和实现基于样本选择的启发式属性约简算法。
研究方法
1 经典粗糙集理论
2 决策粗糙集理论
3 两种常用的属性约简算法
4 基于样本选择的启发式属性约简算法
步骤和措施
3月 构建经典粗糙集模型和决策粗糙集模型。
4月 设计两种算法进行特征选择。
5月 数据的采集及统计分析。
6月 论文的撰写和答辩。
该生实验准备工作充分:能收集比较详实的中外参考文献,进行实验设计和准备工作,实验材料准备充分,实验计划安排合理,并已开始论文撰写的前期准备。
希望继续收集资料,完善实验方案,早日开展实验研究和论文撰写。