摘要过程日志的作用日益显著。但是,日志的质量似乎还没有得到足够的重视。过程日志经常出现事件丢失的情况。如果不对这些日志进行修复,那么诸如流程挖掘等复杂事务处理过程是无法正常实现的。根据本文中的算法,可以对日志进行有效的修复。本设计的主要内容是用Java语言实现过程日志修复算法,开发软件工具。该软件能根据给定的过程模型,对一个丢失事件的日志文件进行修复。本文将给出这一开发过程的详细说明,并提出一些提高日志修复效率方法。这些方法将在程序中进行应用。25433 毕业论文关键词 过程日志 事件丢失 修复 Java
毕业设计说明书外文摘要
Title The Implementation of Algorithm for Recover Process Logs
Abstract
Process logs are becoming increasingly significant.However, the quality of logs are not receive enough attention. Missing events often occur in process logs.Without recovering these logs,complex event processing such as process mining will not work correctly.By means of the algorithm in this paper, missing events in logs would be effectively recovered.The content of the programing is to develop a software using Java on the basis of the algorithm.Given the process specification,the software can recover missing events in logs.In this paper,we will give a detailed elaboration about the process,and put forward some methods to improve the effection of recovery.These methods would be used in the program.
Keywords process logs missing events recovery Java
目 次
1绪论 1
1.1选题背景 1
1.2应用领域 1
1.3论文结构 1
2 相关技术与平台介绍 3
2.1 MyEclipse 3
2.2 Java语言 3
2.3 dom4j 3
2.4 XML 5
2.5 测量时间的方法 6
3基本概念 7
3.1 Petri网 7
3.2 流程规范 8
3.3 引发序列 8
3.4 修复 9
3.5 Casual网 9
3.6 等价修复 9
4 设计思路 10
4.1 数据结构 11
4.2 基于Casual网的修复 13
4.3 基于选择结构的拓展 15
4.4 基于循环结构的拓展 17
4.5 主要步骤流程图 21
5对于增强软件性能的探索 22
5.1 算法选择的改进 22
5.2 对日志含有重复序列情况的改进 23
5.3 基于无循环情况的改进 24
5.4 基于算法中k1取值的改进 24
5.5 基于循环情况的改进 25
6总结 27
6.1 程序执行情况 27
6.2 设计过程总结 29
结论 30
致谢 31
参考文献 32
1 绪论
1.1 选题背景
当今社会,企业的业务流程大多是事件驱动的[1],业务流程的执行需要事件来触发和控制。在这些业务流程运行的时候,会源源不断地产生大量的数据。因此,记录工作过程的日志文件也变得越来越重要。然而,这些日志文件的记录情况有时并不是特别理想。由于种种原因,这些日志文件会出现内容缺失、不完整的情况,这会对接下来的工作产生一些不良影响。日志所记录的内容质量得不到保证的话会影响业务智能方法的分析结果,例如复合事件处理[2],源分析[3]和流程挖掘[4]。
事件丢失是日志文件数据质量低下的首要原因[5]。在具体实践中,导致事件丢失的原因有很多,例如人工记录出错、系统记录出现故障、混合存储出错等等[6]。为了解决这个问题,过程日志修复算法就应运而生了。本次设计是对算法理论的一次具体实践过程,目的是开发出实现过程日志修复过程的软件工具,并针对如何提高日志修复效率的问题进行探索。