2。5 数据挖掘的所应用的技术 4
第三章 自动化脚本稳定性 6
3。1 软件测试自动化简介 6
3。2 自动化脚本的功能与技术 6
第四章 数据挖掘技术在自动化脚本稳定性方面的应用 7
4。1 基于分层聚类的代码辅助理解 7
4。2 基于频繁子树挖掘的配置代码推荐 8
4。3 基于关联规则挖掘的配置代码推荐 9
第五章 结语 9
致 谢 10
参考文献 11
第一章 绪论
1。1研究的背景,目的与研究意义
1。1。1研究的背景
人类生活中到处都充斥着数据,比如医疗数据,科学数据,销售数据,金融数据,人口普查数据等等。随着信息化的深入,人们的关注点从单纯的数据转到如何处理这些数据。对于海量的,无规则杂乱的数据,人们十分需要一种技术将传统的数据分析知识与整理海量数据的复杂方法有机结合起来。于是,我们必需找到用的要领,主动的分析数据,主动的把数据进行分类,主动的汇总数据,主动的发现并且描述数据中的走势,主动的标识出异常情况。这是数据最有价值的方面之一,但是仅仅依靠统计学方法和数据库的查询检索功能很难有效利用这些信息。于是,人们急切的需要智能并且自动的将未处理的数据转化为有用数据,并且能够有助于决策。在此种情况之下,在人类现代化生产生活中日益重要的数据挖掘(Data Mining)技术就此产生。
当代软件工程中,有很多问题无法使用传统的方法或者传统的工具来解决它,比如管理和分析非结构化的需求文件,协调并且优化管理开发团队,更加快速并且更加准确的自动编写代码等。随着软件工程数据日益积累,众多问题可以在软件测试的过程中通过数据挖掘技术进行解决。论文网
1。1。2研究的目的与研究的意义
数据挖掘是在大量的应用数据中,这些数据是不完全的,模糊的,复杂的,有噪声的,随机的,提取那些隐含在其中的,之前不被人所了解,但是是潜在有用知识与信息。很多程序缺少大部分文档数据,以及编制带有注释的代码,如果程序出现代码错误和缺陷,开发人员难以定位错误代码,进而修正错误有着极大的不便,而且修改已有的错误容易连带其他代码出现新的错误。而应用在自动化软件测试脚本中,数据挖掘能够更加智能的提高阅读代码的效率,软件开发的周期得以缩短,降低开发软件的成本,测试软件的范围得以覆盖,这将极大的提高软件开发的效率,并缩短软件开发的周期,这在软件开发的过程中是十分有必要而且有优势的。
1。2国内外研究的现状及发展趋势
第二章 数据挖掘概论
2。1数据挖掘概念
数据挖掘是通过数理模式来分析大量资料的一种分析方法,也称为数据库中的知识发现(Know ledge Discovery in Databases ,KDD),也可称为资料勘探,数据采矿,近年来已成为数据库领域以及人工智能领域所研究的重要内容。数据挖掘一般是指从海量数据中自动搜索,并能发现隐藏于数据之中,有着特殊关系性信息的过程。它是一种能够服务于决策更好的形成的过程,它一般与计算机领域有关,通过许多方法实现目标,例如在线分析,情报检索,专家系统,统计方法,机器学习,模式识别等等工具。数据挖掘主要在机器学习,模式识别,统计学知识,人工智能,可视化技术,数据库,充分的自动分析海量数据,做出回归性理论,在其中找出潜在的知识与模式,帮助决策者做出决策,预测风险与可能出现的问题与缺陷,是一种深层次的分析手段。