众包测试报告的挖掘与评估

来源 :大连理工大学 | 被引量 : 3次 | 上传用户:hnyqk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众包测试是一种新兴的软件测试方法,已经引起了学术界和工业界的广泛关注。众包指的是通过公开调用的方式,将由公司完成的任务众包给一群未定义的潜在的地理上分散的在线个体,每个个体可以称为众包工人(crowd worker)。在众包测试中,工人帮助开发者执行测试并提交测试报告,开发者需要对提交的测试报告进行人工审查和评估。由于测试报告庞大的数量以及广泛变化的质量,开发者人工审查测试报告时遇到了一系列难以处理的问题,这些问题严重影响了开发者的审查速率和效率。因此,本文尝试对众包测试报告进行深入地挖掘和评估,帮助开发者更高效地处理众包测试报告。本文主要从两个方面开展研究。一方面通过减少测试报告的数量来帮助开发者减少人工审查代价;另一方面,通过分析测试报告的质量来帮助开发者提高审查测试报告的效率。本文主要取得了以下研究成果:(1)为了帮助开发者减少众包测试报告的审查代价,本文提出了众包测试报告模糊聚类问题。为了求解这个问题,本文提出了一个众包测试报告模糊聚类框架(TERFUR)。首先,利用两个启发式规则过滤掉无效的测试报告;然后,采用自然语言处理技术预处理众包测试报告;最后,采用一个二阶段模糊聚类方法来实现众包测试报告模糊聚类。五个数据集上的实验结果显示TERFUR能聚类测试报告最高达到78.15%的微平均精度,78.41%的微平均召回率和75.82%的微平均F1值。同时实验结果也显示TERFUR平均能识别95.33%的无效的测试报告。(2)为了帮助开发者确定测试报告审查序列,本文尝试求解测试报告优先级问题,并提出了一个基于分类的众包测试报告优先级方法(DivClass)。该方法首先通过采用自然语言处理技术来预处理众包测试报告,然后结合一个多样性策略和一个分类策略来实现测试报告优先级划分。为了评估DivClass的效果,本文在五个众包测试报告数据集上执行实验进行验证。实验结果显示DivClass平均能实现0.8921的平均缺陷检测率。同时实验结果也显示,相较于已有的方法,DivClass能减少被审查的测试报告数量最高达到 63.74%。(3)为了帮助开发者预测在有限的资源内,一个测试报告是否应当被选择进行审查,本文提出了众包测试报告质量评估问题。为了有效地求解这个问题,本文提出了一个众包测试报告质量评估框架(TERQAF)。首先,本文总结了众包测试报告的期望属性,然后定义一系列的可度量指标来评估这些期望属性,最后利用阶步转变函数将所有指标数值化的值转变为标称值(即好的、坏的),并聚合所有指标的标称值来预测测试报告的质量。五个测试报告数据集上的实验结果显示本文提出的算法在预测测试报告质量时最高能实现88.06%的精度,超过可比较算法最高达到23.06%。(4)为了改善测试报告的质量,本文提出了众包测试报告增强问题,即利用重复测试报告中包含的额外的有价值的信息来增强主测试报告。为了有效地求解这个问题,本文提出了众包测试报告增强框架(TRAF)。首先,自然语言处理技术被采用来预处理众包测试报告;然后,利用三种增强策略来实现测试报告不同字段信息的增强;最后通过可视化增强的测试报告来帮助开发者更好地辨别增加的信息和原始的信息。五个数据集上的实验结果显示TRAF获得的排序结果平均能达到98.65%的NDCG,同时能识别有价值的句子平均达到83.58%的精度、77.76%的召回率和78.72%的F值。
其他文献
高中数学新教科书增加了许多拓展性课程资源,这些内容具有其特定的教育教学功能与价值.在实际使用教科书的过程中,这些内容陷入了高评价低使用率的尴尬境地.调查发现主要原因
目的 :观察养阴润肠方对慢传输型便秘大鼠结肠Cajal间质细胞的影响,探讨其通便的机制。方法 :随机将30只SD大鼠分为造模组(24只)及正常对照组(6只)。正常对照组给予蒸馏水灌
兰考县作为首个国家级普惠金融改革试验区成立以来,国库部门承担着普惠金融工作中提供国家财政资金基础性金融服务的职责,论文以人民银行开封市中心支行国库部门支持兰考县普
目的通过对大前庭导水管综合征(LVAS)患儿家长不同病程阶段的焦虑现状分析,采取针对性的护理对策以减轻LVAS患儿家长的心理负担,认识接受疾病,给予患儿恰当有效的护理,提高患
纯碱生产工艺中,碳酸化工序被称为纯碱生产技术的核心.在碳化塔各项工艺操作中,其碳化工艺操作中的冷却技术,对碳化转化率,结晶等技术指标的控制起到至关重要的作用。多年来,制碱
针对基于项目的协同过滤推荐算法在数据极度稀疏的情况下相似性度量不准、推荐质量低下的不足,借鉴基于云模型中的云相似性度量方法来实现基于知识层面的项目相似性度量,改进
运用文献资料法等,探讨非裔美国运动员在美国竞技体育界受歧视现象的历史缘起与存续现状。认为:基于美国资本主义社会的历史背景和多民族结构的种族主义现状,虽然非裔运动员
随着科学技术的发展,家用电器日益趋近于智能化,模糊逻辑在家用电器产品中的应用得到快速增长。对智能洗衣机的模糊控制进行分析,研究洗衣机的模糊控制系统结构,确定控制器的输入
目的:探索髓核移植接触神经根后对大鼠诱发电位及神经显微结构的影响。方法:20只SD大鼠随机分成2组,A组、B组分别取大鼠自体皮下筋膜脂肪及尾部的髓核组织,无压迫下放置在L4~
目的研究骨关节炎(OA)患者血清中p50、p65、TAK1、NF-κB抑制因子(IκBα)、细胞因子及凝血指标的变化并进行相关性研究。方法对40例OA患者及9例正常对照分别抽取静脉血,离心