2。4 中小学信息化学习资源存在的不足
在大数据的环境下,由于中小学学习资源系统巨额经费的投入、大量学习者的使用、广泛的教育覆盖面、灵活多样的学习方式,推动了各种中小学学习资源的广泛传播和迅速积累,然而学习资源的使用方式和思维却并没有与时俱进。中小学的师生们在通过互联网获取资源时,仍存在着大量问题,例如:检索结果数量繁杂、分散无序,不能进行个性化推荐;资源间缺乏关联性和针对性;资源构造类型不合理、难以进行组织管理;资源缺少启发性,教师不能有效应用学习资源进行教学监督,学生也不能高效利用资源自主学习。
3 大数据背景下学习资源的特征
3。1 学习资源具有针对性和关联性
大数据时代,海量的学习资源可供使用者挑选。但师生们并非直接使用后台大规模、低价值的数据,而是通过搜索引擎,抽取其中符合自己查询特征的数据。但由于资源的庞大,经常出现信息大量冗余的情况,所以使用者还需对结果进行二次筛选。这使资源的获取非常的低效和麻烦。因此一个合理的资源组织,应该针对用户的需求,进行个性化推荐,使资源的获取变得高效而容易,这就要求大数据系统把用户的数据由之前“因果关系”线性组织,转为“关联关系”网状组织,通过聚合使用者曾经输入的检索词、检索历史等数据资源,优先排序检索结果中的相关资源,帮助用户快速获取需要的信息。比如,学生在搜索优秀范文时,通过分析曾使用的学习资源,关联同一作者或同一类型文献的相关资源信息,自动进行相似文章推荐[7]。
3。2 学习资源具有实时性和高效性
在大数据时代的背景下,一方面,资源无时无刻不在产生、变化,因此我们必须以动态的视角去观察和捕获数据的包含的信息和价值,保证结果具有时效性;而另一面,资源的爆发式地增加,不得不开始使传统的数据处理方法和思想方式逐渐淘汰,通过人脑或者手工的方式已不再能全面捕获资源包含的信息和价值。因此,我们需要用创新的思维,智能的工具(比如计算机),来大量和实时地处理低密度价值的大数据,及时获得有价值的资源。
3。3 学习资源具有高度的离散性文献综述
大数据的核心特点,常被归纳为“4V”,即数据量大(Volume)、输入和处理速度快(Velocity)、数据多样(Variety)和精确性(Veracity)。但是正是因为庞大的学习者群体,多样的学习方式,海量的学习资源,使得大数据时代,涌现出学习资源分散无序、离散程度高、资源之间缺乏相关关系、利用效率低、缺乏传统的资源建设模式下严谨的资源学科分类体系等问题。而这些主要是因为资源之间离散程度高,聚合性不足引发的。自然而然,如何利用学习资源聚合等技术手段解决资源离散成为当前教育技术关注的热点问题。资源聚合是指对信息资源的“聚集和整合”[8]可以通过对数据进行分析关联,进一步挖掘出资源之间隐含的关系,从而实现对资源组织进行深度聚合的整体框架体系的构建,解决以上的种种问题。
4 资源聚合的设计及实现
4。1 学习资源聚合方法的选择
在获取中小学学习资源时,78%的师生通过搜索引擎来获取互联网的信息化学习资源,而资源检索就是将符合用户输入信息的所有资源数据都聚集到一起,再呈现出来。在大数据环境下,信息化学习资源的组织建设大多数都是无序的,资源之间的关系也存在无序性,而使用资源的学习者们却是数量巨多而又复杂的,他们的学习需求更加的个性化,多样化,复杂化,所以使用者在对资源进行检索后,呈现的检索结果很多时候是不能满足学习者的使用需求的。这要求海量的数据资源在不需要人力参与的情况下,能够自动聚合并推荐符合学习者个性的学习资源,最终生成具备内涵逻辑关系的资源结构体。而聚类分析常用于资源结果的处理,并能够对结果进行个性化推荐,因此在设计中,选择无监督的聚类算法对资源进行分类、聚合。总体框架设计包括对学习资源的初级聚合、设计聚类分析的具体步骤,对分析结果进行再优化。