1.2 研究内容 云平台下科学工作流挖掘是目前具有前瞻性的一项工程,具有非同寻常的应用价值和现实意义。其意义主要体现在: (1)应用“云计算”平台,提高科学工作流挖掘的效率,同时可以由任务处理量控制花销与能量消耗。提供一种以简单的方式访问互联网服务器以应用科学工作流挖掘的数据处理功能。 (2)为企业及科技工作者提供了一种方便的科学工作流挖掘工具, 实现其对工作流管理系统的维护与更新。从根本上提高企业业务处理的效率,提高现实竞争力。 (3)通过云平台的分布式计算,减少了单个物理机器的计算压力,实现大数据量分析,并且从现实基础上减少了开销。 综上所述,本论文基于“云计算”平台,从科学工作流的定义与已有数据入手,参考图论等知识,通过分析科学工作流挖掘所需要的必要资源,在指导老师的指导下完成科学工作流挖掘的算法与工具的实现。 此论文的主要研究内容如下: (1)了解云平台相关应用知识,搭建云环境,并且实现虚拟云平台下的科学工作流挖掘的仿真实验。 (2) 研究学习一种比较成熟的科学工作流挖掘算法 Alpha 算法,并改进 Alpha 算法,提出一种可行的科学工作流挖掘算法,并实际开发出有效的科学工作流挖掘工具。然后在已有数据的基础上,即26个科学工作流原型及其变种,用信息检索的相关指标评价算法的正确性及其效率。
1.3 国内外研究现状 现在国内外主要是由荷兰Vander Aalst带领的科研小组对工作流挖掘有深厚的研究。其中一种基于 Petri 网的工作流挖掘算法 Alpha 算法是一种已经比较成熟的算法,能够完成科学工作流挖掘的大部分任务。Petri 网是对离散并行系统的数学表示,适合于描述异步的、并发的计算机系统模型[2]。Petri网既有严格的数学表述方式,也有直观的图形表达方式,既有丰富的系统描述手段和系统行为分析技术,又为计算机科学提供坚实的概念基础[3]。 国内也有部分高校对基于 Petri 网的工作流挖掘算法 Alpha 算法进行改进,提出一种新的算法。本文不考虑基于 Petri 网的工作流挖掘算法,提出一种较为简单的挖掘算法对一些简单科学工作流进行挖掘。 云平台下科学工作流挖掘(2):http://www.youerw.com/jisuanji/lunwen_42832.html