数据挖掘(DM)与 “数据库知识发现” (KDD)的定义内涵和外延很是相似。在认知方面往往众说纷纭,莫衷一是,但主要以两种观点为核心。一种观点认为知识发现[1]是从大规模数据中挖掘知识过程,而数据挖掘是这个组成过程的重要部分。另一种认为两者都是指发现知识的全过程。75134
1989年8月,第11届国际人工智能联合会议的专题讨论会在美国底特律召开,会议上首次提出KDD这个概念。之后在1991年-1993年时间几乎每年都会举办KDD专题讨论会,受到诸多科研爱好者的青睐,聚集了来自世界各地的研究人员和应用开发者,涉及领域多且广。他们在一起研究讨论,分享自己的研究经验,结合大家的分析交流,制定研究计划,分别对海量数据分析算法,数据统计以及知识表现和运用等问题作出了系统性的探索。
从决策技术诞生之际至今,这门高端的技术受到诸多数据挖掘系统应用的研究者高度关注,软件公司对此更是高度赞扬,其影响力可见一般。在此期间,国内外多家公司都争相亮相了数据挖掘系统,他们当中绝大多数都采用了决策树方法。譬如,Microsoft 公司的OLE DB for Data Mining用数据挖掘软件包来为客户提供高质的服务。而SAS公司则使用自己开发的数据挖掘工具SAS Enterprise Miner[2] 通过收集分析各种统计资料和客户购买模式,帮助用户发现业务的趋势,解释己经知道的事实,预测未来结果,并识别完成任务所需关键因素,最终实现增加收入并降低成本的目的。IBM公司的Intelligent Miner[3] 具有典型数据集自动生成、关联发现、序列规律发现、概念性分类和可视化显示等功能,可以自动实现数据选择、数据转换、数据挖掘和结果显示。中国科学院计算技术研究所智能信息处理重点实验室开发一种名为MS Miner[3]的多战略常识发现平台,论文网能够提供快捷有效的数据挖掘解决方案,提供多种知识发现方法。
通常情况下,教学管理会通过分析学生成绩的方式研究教学质量,而通过数据挖掘技术分析学生成绩数据挖掘的新领域。在国内,梁丽莎女士在她的《数据挖掘技术在教学中应用》中采用决策树算法,通过这种算法分析学生成绩成效显著。结果显示,学生成绩主要受学习兴趣、课外内外学习时间、教师教学方法等因素的影响,并对数据进行预处理、然后进行数据集成、最后完成数据消减。理论上证明了方法的可行性,但缺乏一定得理论和实践的试验证明,相应的也就降低了说服力。与梁丽莎现不同的是,倪现君在《基于数据挖掘分类技术的高等教学方法研究》中使用ID3算法生成决策树,在研究过程中制定了分类规则,从而为决策树的产生、决策树模型的建立提供了契机,最为成功的是,这个模型对分析学生成绩,教学评价都有着非常好的效果。尽管优势很多,但它依然没有考虑无关因素对结果准确性的影响。除此之外,任承业将数据挖掘技术应用于校园信息系统的CRM的建设中,张德新则在对人才素质分类过程中引入了K-Means。
总而言之,数据挖掘技术随着时代的发展与时俱进,它已经从最开始的碎片化,表面化,逐渐沿着综合系统,全面完备的方向发展前进。如今,人们常常侧重研究数据挖掘技术应用价值和理论精神,诸如算法研究、理论研究和应用研究。这三块是数据挖掘研究的三大核心领域。在本文中,一方面将重点研究数据挖掘技术在教学管理中的实际应用价值,通过结合学生的考试成绩的方式,在学生的成绩评估中引进数据挖掘技术,进行深入全面的分析探讨;另一方面,文中还会通过决策树技术来分析影响学生的成绩的关键因素,旨在从根源上找到能够对学生成绩造成影响的因素,进而为学生提高学习效率,学习成绩以及教学质量提充足供事实依据。 数据库知识发现KDD研究现状:http://www.youerw.com/yanjiu/lunwen_85962.html