一些病毒防御软件判定一个应用程序是否是virus(病毒)或者worm(蠕虫)是通过分析该程序调用操作系统的API历史记录来分析其行为是否正常的。这里的API历史记录也是系统日志数据中的一种。它记录了某应用程序在什么时刻调用了什么API,API的参数和返回的API调用情况并记录在数据库中。当发现某常规应用程序的API调用日志记录出现异常的模式(比如过于频繁地调用获取磁盘文件目录的API),而此应用程序并非是磁盘扫描或者修复软件,那么就可以怀疑此应用程序在窃取用户个人数据或者企图植入病毒。
1.2 研究现状
1.3 本文的工作和内容组织
针对复杂计算系统的系统管理和优化问题,以计算系统的系统日志数据为研究对象,研究日志数据的预处理方法,设计事件摘要模块,实现事件摘要方法,提供从宏观层面的对于日志数据的描述,从而为事件挖掘提供支撑。
因此需要掌握针对日志数据预处理的方法,以及事件摘要的理论知识和方法,针对特定的日志数据,通过文献查找、阅读和归纳分析,设计并实现事件摘要方法,完成日志数据预处理模块和事件摘要模块的设计和实现,与数据挖掘平台进行集成。
本文的结构安排如下:
第一章主要论述本文的研究背景,工作意义,并且介绍现有的技术和本文的研究工作。
第二章是关于数据预处理、事件摘要、模式分析的基本概念、基本理论、基本方法的介绍。
第三章具体阐述了本文中使用的数据预处理方法,介绍本文采用的日志文件数据的格式及其处理过程,并且展示了数据库设计。
第四章详细阐述事件摘要方法,通过标准直方图发现事件关系并用合适的模式描述,最后通过事件关系网络展示了发现的模式,作为简单的可视化结果,是本文的核心章节。 基于日志的事件摘要模块设计与实现(3):http://www.youerw.com/jisuanji/lunwen_21410.html