毕业设计(论文)题目 基于粗糙集的特征选择及其分类研究面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?
分类和特征选择充分的回答了这个问题。84451
数据挖掘中有很多领域,分类就是其中之一。什么是分类?分类就是把一些新得数据项映射到给定类别的中的某一个类别,比如说当我们发表一篇文章的时候,就可以自动的把这篇文章划分到某一个文章类别,一般的过程是根据样本数据利用一定的分类算法得到分类规则,新的数据过来就依据该规则进行类别的划分。
分类在数据挖掘中是一项非常重要的任务,有很多用途,比如说预测,即从历史的样本数据推算出未来数据的趋向,有一个比较著名的预测的例子就是大豆学习。再比如说分析用户行为,我们常称之为受众分析,通过这种分类,我们可以得知某一商品的用户群,对销售来说有很大的帮助。
然而数据库中的数据并不是全部有用,其中包含着大量的冗余数据。特征选择恰是用来去除信息系统中冗余数据的工具之一。
1 糙集理论历史发展
二十世纪九十年代,波兰学者Pawlak提出了粗糙集理论,并发表了第一本关于粗糙集的专注《Rough Sets: Theoretical Aspects of Reasoning about Data》。之后的几十年,粗糙集理论迅速发展,并逐渐从东欧走向世界。在粗糙集广泛传播的过程中,中国的学者也认识到粗糙集理论的重大发展潜力,开始致力于粗糙集理论的广泛研究。随着研究的不断深入,开始不断涌现出诸多粗糙集研究学者和团队(如刘清、张文修、梁吉业、苗夺谦、王国胤、杨习贝等学者),并在粗糙集研究领域获取了一系列的研究成果,为粗糙集在中国乃至世界的传播和发展做出了极大的贡献。
近年来,随着粗糙集不断增长的影响力,与粗糙集理论研究相关的国际国内会议也越来越多。第一届国际粗糙集研讨会于1992年在波兰召开自此以后每年都有关于粗糙集理论及其应用的国际学术会议召开。与此同时,一些国内外重要学术期刊(如Information Sciences, Transactions on Rough Set, Knowledge-based System, 计算机学报,软件学报,自动化学报等)大量刊登与粗糙集相关的学术论文,称为了粗糙集理论交流和最新研究动态展示的重要平台。论文网
2 粗糙集理论的研究现状
近年来,随着粗糙集理论的普及,越来越多的研究者投身其中,并取得了丰硕的研究成果。纵观文献,对于粗糙集理论的研究方向可总结如下2点:
(1) 粗糙集模型泛化推广的研究
信息粒化和近似逼近是粗糙集模型的基石,对于粗糙集模型的泛化也存在着信息粒化和近似逼近两个方向。
在信息粒化方向,经典粗糙集是建立在一种不可分辨关系的基础上对于论域的划分。然而,因不可分辨关系的约束过于严格,在客观世界上常无法找到与其严格对应的应用场景。为此,中外诸多学者采用若不可分辨关系对于经典粗糙集模型进行泛化,使其能更容易的在现实场景找到与之对于的应用实例。例如:为解决连续型数据转换为离散型数据造成的信息损失,1990年Dubois和Prade提出了模糊粗糙集理论。
从近似逼近的角度考虑,为了给粗糙集模型的近似逼近找到一个语义解释,Yao和Wong于1992年提出了决策粗糙集理论。决策粗糙集真正的贡献在于它不仅给出了概率正、负和边界域这个结果, 更重要的是, 它给出了基于贝叶斯决策论的一个语义模型, 同时也给出了一个实际、有效的解释和计算阈值的方法。 也就是说, 决策粗糙集是一个有坚实理论基础同时又实用的一个模型。 粗糙集的特征选择及其分类研究开题报告:http://www.youerw.com/kaiti/lunwen_100205.html