基于数据挖掘的软件缺陷数据预测方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:yyagan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件缺陷是软件的固有属性,其主要危害是影响软件的可靠性、增加开发成本以及延长软件开发周期。软件测试可以及时发现软件错误,提高软件系统可靠性。而准确地预测软件缺陷,对改进软件测试过程有着重要的指导意义。随着计算机技术的飞速发展,软件的规模和复杂程度呈几何级数增长,为了能够准确地对软件缺陷进行预测,需要分析的影响因素也越来越复杂。此时,传统的预测方法已经很难处理具有复杂因果关系的预测问题,而且预测结果往往过于宽泛而失去实用意义。为了解决这一难题,人们开始尝试将其他学科的研究方法应用到软件缺陷预测领域中,其中比较常用的是数据挖掘技术。数据挖掘技术是数据库系统研究领域的一个新的研究方向,能够从大量数据中挖掘出有价值的知识,提供决策依据。本文基于数据挖掘方法,分别从静态软件缺陷数据和动态软件缺陷数据两方面展开研究。本文主要工作如下:静态软件缺陷检测旨在自动检测程序模块中是否包含缺陷,从而加速软件测试过程、提高软件系统的质量以及降低软件测试成本。针对传统静态软件缺陷预测模型被限制在一定的应用范围而影响其预测的准确性和适用性,文中提出了一种基于PSO-BP静态软件缺陷预测模型,该模型运用粒子群优化算法优化BP神经网络的权值和阈值,采用交叉验证的方式进行实验,并与传统的机器学习方法J48和BP神经网络等方法进行了比较,实验表明文中提出的方法具有较高的预测准确性;此外,提出了改进粒子群优化算法的参数设置,实验结果表明对粒子群算法的参数设置改进的有效性。动态软件缺陷预测可以将分析结果及时反馈给测试者,从而改进软件测试过程。针对传统动态缺陷预测模型的假设过多并且通用性不强,文中提出了ESGM模型,即运用经验模态分解EMD算法对原始缺陷数据序列进行分解,对本征模态函数IMF和余项分别使用PSO-SVR模型和灰色进行预测。将模型应用于数据集SYS1的建模预测,实验结果表明模型充分发挥了EMD算法的自适应性、SVR的良好的解决非线性问题能力以及灰色对趋势预测的优势,能够得到较好的预测效果,运用于动态缺陷预测是可行的。
其他文献
近年来,随着互联网技术的飞速发展,信息安全已成为亟待解决的问题。使用公钥密码体制是提高信息安全性的重要方法。硬件实现的密码系统由于其诸多优势成为新的研究热点。本文在
交互式问答系统需要对上下文的语境进行处理,才能使系统有更强的理解交互能力。问句的语义缺失现象是必要处理的核心问题之一。在交互式问答系统中,存在着大量的语义缺失的问句
随着数字海洋一期中对辅助决策系统的进一步研究,现已基本将整体框架建立完备,包括数据源:海洋台站和卫星采集的实时监测数据;传输网络:远海洋数据传输专线和近、中距离3G无线传输
随着社会的发展,人们对空中交通的需求量日益加大,与此同时,一些不合理的机场扩建和航班计划所引发的机场噪声问题却引发了非常大的社会矛盾,如何科学地展示机场噪声成为当前一个
云计算作为一种新兴的分布式计算模式,具有按需自助服务、资源共享、多种网络访问等特点,被广泛地应用于企业及机构。中小型企业通过借助云计算平台外包计算及存储企业数据,
当今世界,随着信息技术的不断进步,各类信息资源都以较快的速度增长并呈现出海量的特征,其中数据主要还是以文本的形式出现。信息量已经满足人们的需求,但是如何高效地管理并且使
单处理器的嵌入式系统已经不能满足用户的需求,多处理器系统已经成为未来嵌入式系统的主要发展趋势。现场可编程门阵列(FPGA)的出现给多处理器系统的设计带来了很多方便。相对于
低密度校验码(Low-Density Parity-Check codes)是目前最接近香农限的一类纠错码。由于其良好的距离特性、低译码复杂度,已成为当今信道编码领域研究的热点之一。随着研究的不
本文主要研究了数据包分类算法,以及数据包分类在入侵检测工具Snort和基于状态包分类的数据流检测中的应用。网络技术的飞速发展,给人们的社会生活带来很大便利。然而,网络用户
语音作为人们交流和表达情感的一种重要媒介,在日常生活中却总是受到噪声的干扰,因此我们需要对混入背景噪声的干净语音进行语音增强。语音增强算法的最终目标就是对背景噪声