ID3算法决策树的学生成绩分析方法(2)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

ID3算法决策树的学生成绩分析方法(2)

20

5。2前景展望 20

参考文献 21

致 谢 22

第一章 绪论

1。1 研究背景和意义

科学技术的进步发展使得人们方便快捷的获得越来越多的信息,但同时带来“信息爆炸”、“筛选有效信息难”等苦恼。而数据挖掘作为新型的数据分析技术,产生于1995年,人们可以利用这门技术更加方便的从海量数据中发现并提取有用的信息。在过去的十几年里,数据挖掘的研究工作取得了很大的进展,成功应用到医疗、金融、管理学等领域。各种数据挖掘软件的开发与应用大大地推动提高了人们处理、筛选信息的能力,也给人们带来了庞大的经济效益。

近年来,随着学校的不断扩招,学生的数量呈阶梯式俱增,相应的影响学生成绩的因素也变得越来越多。学生对所学知识掌握的情况在一定程度上能通过成绩反映,同时它也是评估教师教学水平以及教学质量、教学品质的关键因素,因而成为学生评价体系中非常重要的一个指标。传统的学生成绩分析一般是查询某位学生的课程分数,统计某门课程的各个成绩段的学生人数等。但是这种方式局限性比较大,只是基于数字本身来考虑,而没有深入分析大量已产生的成绩数据,想发挥其积极作用还是比较困难的。不过,值得一提的是数据挖掘技术就能对与学生成绩相关的数据进行抽取、转换,分析他们背后隐藏的特征,进行模型化处理,从而找到影响学生学习成绩的真实原因,来采取相应举措,从而为教学活动的开展提供了有价值的信息。数据挖掘技术的产生和研究,一方面,有利于教师增强教学效果,提高教学质量;另一方面,有利于提高学生学习的自觉性,学习效率和学习成绩。 

1。2 国内外研究现状

第二章 数据挖掘的相关理论

2。1 数据挖掘技术

数据挖掘[4][5]就是指从大量的、不完全的、有噪声的、模糊的、随机的原始数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用、可信新颖的信息和知识的过程。在数据挖掘中的信息和知识没有明确的范围和界限限制,它可以是概念、规则,也可以是规律、模式和相关约束,来源形式可谓是多种多样,所涉及的领域多,内容涉及面广阔,包括文本、图形、图像和其他领域内的半结构化数据,关系型数据库中结构化的数据以及延伸在网络上的异构型数据。数据挖掘发现的知识和信息的用途很广,可以被广泛的应用于信息管理、决策支持、过程控制以及查询优化等问题的解决方面。总而言之,它涉及到不同的领域各个方面,理论的发展和应用价值不可估量,前景非常广阔,是一门传统而又与时俱进的交叉型学科。

数据挖掘的研究主要基于数据库、人工智能和数理统计三大技术前提。数据挖掘技术的形成过程如图2-1。论文网

图2-1数据挖掘的形成

从图中我们可知,数据库理论的发展形成了数据仓库,人工智能的前进促进了机器学习的进步,这些技术与数理统计理结合产生了数据挖掘。

2。2 数据挖掘的过程

数据挖掘与其说是计算机的按部就班式工作,不如说是循环往复式的人机交互式沟通、信息处理的过程。由于不同的数据来源和差异的含义,以及应用领域所追求需求不同,数据挖掘的步骤不一致相同。一般来说,这个过程主要包含四个阶段[6]:确定业务对象、数据准备、数据挖掘、结果表达和解释。 

1。确定业务对象

(责任编辑:qin)