2)数据梳理法。对收集到的有关研究生和导师的数据进行整合梳理,即同时也是对要研究的问题进行梳理。

3)数据挖掘法。本文运用从所读期刊专著等文献中学到的数据挖掘方法对JKD的研究生及导师队伍的数据进行挖掘研究,找出其中蕴藏的知识。

4)可视化展现法。本文对挖掘出的有关知识信息,利用数据可视化的方法对其进行表示,使其直观清晰。

5)归纳总结法。本文对挖掘出的信息进行归纳分析,最后总结得出结论。

2 相关研究方法概述

2。1 数据挖掘概述

  2。1。1 数据挖掘定义

数据挖掘有很多种定义,包括数据挖掘是从大量数据中提取有用信息的过程[13],是从海量的混杂的大量数据中抽取或挖掘有用模式或知识的过程[14],是从海量的数据中提取出人们感兴趣的事先未知的、不平凡的和有潜在用途的知识的过程[15]等。总的来说,数据挖掘就是从不完整且包含噪声的海量设计应用数据中,提取出隐藏的、人们事先未知却有用的知识或者模式的一个过程[16]。

通过以上的定义可知数据挖掘的对象就是大量的、真实的、随机的和包含噪声的数据,其目的就是挖掘出人们感兴趣的有用的模式或知识即从数据中“淘金”获得智能的过程,而且挖掘出的价值信息并不是适用于所有领域,可以仅仅支持某个特定领域的某个问题。

  2。1。2 数据挖掘过程

在认识数据挖掘过程之前,首先要了解数据挖掘与知识发现(Knowledge Discovery in Database,KDD)之间的关系。数据挖掘与KDD紧密相连,初学者往往认为数据挖掘与知识发现就是同义词,但严格来说数据挖掘只是知识发现过程中的一个核心环节,数据挖掘最终是要挖出有用的知识。

一个完整的数据挖掘过程主要分为三个阶段:数据准备阶段、数据挖掘阶段和结果的解释和评价阶段[17]。而数据准备阶段又包括数据清洗、数据集成和转换与数据归约和变换。一个数据挖掘的完整过程如图2-1所示。

1)数据清洗(data cleaning)。对不完整和包含噪声的数据进行噪声和无用数据的清除,空缺值的填补,异常值的修正。对噪声清除的方法有分箱、聚类分析与回归分析等;对空缺值处理的方式有忽略元祖、忽略属性列、人工填补和自动填补等。

2)数据集成(data integration)。把来自多个数据数据源的数据整合一致存储到一起的过程。

3)数据选择(data selection)。根据要挖掘的对象及目标,从数据仓库中抽取出相关数据集来提高数据的质量。

4)数据转换(data transformation)。将选出的数据转换为易于被挖掘的形式。数据转换包括平滑、聚集、数据泛化、规范化、属性构造和数据离散化[13]。

5)数据挖掘(data mining)。利用智能的方式从数据中挖掘抽取出规律或模式。

6)模式评估(pattern evaluation)。根据一定的评估标准,使用某种特定的手段对发现的规律或模式进行评估以选出有意义的知识。

7)知识表示(Knowledge representation)。对挖掘出的规律知识利用可视化的方法和知识表现技术进行解释,最终转化成用户易于理解的知识。

\

图2-1  数据挖掘过程

数据挖掘过程中的步骤是要反复循环执行的,任何一个步骤出现错误或与目标不一致的情况都要返回重新执行操作,直到与预期目标一致为止。

  2。1。3 数据挖掘的方法

数据挖掘中用到的方法主要有:

1)关联规则

关联规则顾名思义就是数据对象之间互相的依赖关系,要找出关联规则的任务就是要从数据集中发现那些支持度和置信度都大于某一给定值的强关联规则。当今,关联规则从单一概念层次已经发展到多概念层次,在概念层次上的不断深入发展使关联规则所提供的信息也就越来越实际和具体。

上一篇:江苏省研究型大学本科教学质量保证体系研究
下一篇:镇江高专学生评价体系中的问题及对策研究

《吹小号的天鹅》对儿童...

马尔库塞海德格尔式的马...

马克思的就业思想及其當代价值【2903字】

马克思恩格斯教育思想及...

马克思主义跨越理论及其...

马克思主义自然观及其當代价值【5261字】

马克思主义群众观的理论...

麦秸秆还田和沼液灌溉对...

网络语言“XX体”研究

新課改下小學语文洧效阅...

安康汉江网讯

LiMn1-xFexPO4正极材料合成及充放电性能研究

互联网教育”变革路径研究进展【7972字】

老年2型糖尿病患者运动疗...

我国风险投资的发展现状问题及对策分析

张洁小说《无字》中的女性意识

ASP.net+sqlserver企业设备管理系统设计与开发