基于模型结合的缺陷定位研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:gyf2033
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缺陷定位是软件调试过程中花费代价最大的工作之一。为了辅助程序员更好地在大型软件中找到含有缺陷的语句,减少缺陷定位所需要的时间和耗费,研究者提出了许多自动化缺陷定位方法。这些方法可以有效的提高缺陷定位的效率,但仍然存在诸多不足。其一,单一的缺陷定位方法往往基于特定的程序状态信息,因而也只能处理相对应的程序错误类型。因此在实际调试过程中很难确定使用哪种缺陷定位方法。其二,目前大多数缺陷定位方法均基于单一类型的程序节点(如语句、谓词等),所得到的多种程序信息并没有被充分利用,这使得缺陷定位的精度受到了一定的限制。为了充分利用多种程序信息,本文提出了一种结合多种基于频谱信息的缺陷定位算法的集成框架。该框架主要是借鉴机器学习领域中的集成学习的思想,对多种基于频谱信息的缺陷定位方法进行了比较深入的研究和分析。这个集成框架主要包括程序信息的收集和模型集成算法的实现。本文实现了基于LLVM编译器的插桩工具对程序信息进行收集。本文对LLVM编译器的框架和Pass插件子系统进行了介绍,并根据程序的特点提出了对程序的语句覆盖信息和谓词信息进行收集的方法,并在LLVM编译器的环境下进实现了对程序的语句覆盖信息和谓词信息收集的插桩工具。本文使用这两个插桩工具收集Siemens程序集的语句覆盖信息和谓词信息。此外,本文实现了基于语句覆盖信息缺陷定位模型和基于程序谓词信息缺陷定位模型结合的方法。由于基于语句覆盖信息和程序谓词信息的两种缺陷定位模型存在一定的差异,本文选取了Tarantula方法和SOBER方法进行结合。由此,本文设计了3种模型结合算法:简单组合算法、Max-mix Rank算法和Mid-mix Rank算法。在利用Siemens程序集所得的实验结果表明,与基于单一频谱信息的缺陷定位模型相比,简单组合算法和Max-mix Rank算法具有更高的缺陷定位效率,并且具有更强的泛化能力。
其他文献
该文主要研究了网络安全的关键技术:防火墙技术?工作员首先提出了防火墙技术参考模型,该参考模型的基本构件是认证功能构件、完整性功能构件、访问控制功能构件、审计功能构
联盟形成问题是多agent领域内的重要课题,当前对其的研究多集中于确定领域,即假设环境是完全信息的,但不确定性是多agent系统的固有属性,能不能有效地解决系统中存在的不确定
目的:我们最近提出了一个预处理交替投影算法(PAPA),以求解SPECT重建的惩罚似然优化模型。该算法是一种崭新的不动点邻近方法。本工作的目的是研究PAPA如何能被有效应用于真实
该论文的背景是开发基于国产开放系统平台COSA/COSIX的Java虚拟机.论文在第一章给出虚拟机的综述,其后的各章结合他们在开发过程中的具体实践对虚拟机的关键技术进行了深入的
第二代测序技术是近20年来生命科学领域最为重要的技术之一。该技术的出现使得从基因组层面通过大数据来分析生物学问题成为可能。目前,随着技术的不断进步第二代测序技术已在
在该文中研究人员着重研究了NCAI系统的协同环境问题.研讨了协同环境的构造方法,站在一定高度对NCAI系统教学体系结构之一Multi-Agent体系进行了阐述,通过设定系统Agent,协同
该文简要介绍了Access/VBA的发展历史、基本服务和主要技术,以及开发管理信息系统的方法.从分析系统需求、系统规划和建设原则入手,简述了武警学院教务管理信息系统开发和建
符号识别和形状检索在工程图纸、历史文档、乐谱、数学表达式等的自动分析与识别中发挥着非常重要的作用。一个理想的符号识别算法应该通用、计算效率高、易扩展,且在噪声、
该文强调的是从脑的生理和心理发展孕育了智能这样一个角度来探索人工智能的研究方法,即所谓脑机制.该文认为知识结构的最初和最基本形态是以知觉后象,即表象为基础的语义网
在具有成功设计和开发第三代新闻采编系统的经验基础上,作者充分分析了报社内部的业务和数据运行规律.分别从信息仓储系统的技术发展和报业信息资料应用发展的角度,分析了传