一种基于扩展QBC的成本估算模型校淮方法

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:yybbxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件成本估算是软件项目计划中至关重要的一个环节。经由估算得出的信息,是指导人力资源的分配,进度节点的设定等计划活动所必需的。过高和过低的估算结果都会对项目计划的执行造成不利的影响,甚至可能导致项目的失败。   在软件工程的领域中,软件成本估算的研究已经进行了多年,其间提出了多种估算方法和模型。以COCOMO为代表的参数化估算模型正在得到越来越广泛的应用和认可。刚刚开始采用参数化估算模型的组织(下文简称为起步组织),没有充足的历史项目数据,训练实例1的选择也就无从谈起。所幸的是,COCOMO、ISBSG、CSBSG等软件联盟已经收集了多个软件组织在多个应用领域中的历史项目数据,放到数据库中。不过,这些数据的取值范围较大,数量较多,难以直接判断它们是否适合于特定的起步组织。   本文提出了一个从多组织的数据库(不包含起步组织的数据)中选择训练实例的方法。它的主要过程受到了QBC2的启发,现简述如下。首先给定起步组织采用的参数化估算模型(下文简称为目标模型),把少量的种子实例作为初始的训练实例集合(下文简称为训练组)。然后一步一个地从备选的实例数据库中挑选实例,把它们加入到训练组中。当训练组达到预定大小时,就用它来进行训练,得到一个组织特有的目标模型。在每一步中,每一个备选实例会被加入到训练组的副本中,形成临时训练组,由此计算出这个实例的校准适合度,然后抛弃临时训练组。遍历所有的备选实例后,适合度最高的就被加入到训练组中,并从备选的实例数据库中删除。种子实例集合主要用来定义怎样的备选实例是适合这个组织的。   校准适合度是下面三个指标的加权和。第一个是参数范围指标。用当前迭代之前的各步的临时训练组,训练出一组目标模型,它们的可变参数3的变动范围就是它的值;它的权值是负数;它的作用是维护训练组跟种子实例的一致性。第二个是数据范围指标。它的值是临时训练组的实例在所有数据维度上的变动范围;它的权值是正数;它的作用是限制训练实例之间过度相似。第三个是预测差异指标。根据临时训练组,训练出一个目标模型,再训练出一个或者多个其他类型的估算模型,它们在训练组上的预测值的差别就是它的值;它的权值是负数;它的作用是限制训练实例过度拟合于目标模型。   案例研究说明,在起步组织需要选择训练实例以便校准模型时,本文提出的方法能够根据给定的种子实例集合,从多组织的数据库中选择适合本组织的训练组,由此得出的目标模型可以达到足够的估算精度。而且,相比于其它的选择训练实例的方法,比如相似优先的选择和随机的选择,本文提出的方法更好的利用了组织之间的差别,得出的目标模型在组织内部具有更好的估算精度。  
其他文献
近年来,随着云计算的发展,在云配备的弹性资源供给基础上已开发了多种中间件,用于支撑云应用的快速部署、高效运行和轻松维护。考虑到复制技术是增强分布式服务的关键技术,而云环
服装的购买主要分为定制、实体店购买与网络购买。定制服装以及到实体店购买服装,必定要量身剪裁或亲身试衣。无论是设计师抑或消费者,在何种情况下,均对服装是否合体有较高的要
数据获取和控制系统是高能物理及其他各种大型科学实验装置中不可或缺的两个重要系统,而数据获取系统中的读出计算机和控制系统中的前端控制计算机是各自系统中的关键设备。本
心电图在医学和模式识别领域有着很重要的作用,使用计算机对心电信号进行自动诊断对于医学等领域有着很重要的意义。论文提出了一种以心电信号形态特征为基础,基于信号分段,
随着Web服务不断的推广,网络中出现大量功能相同或者相似的Web服务。由于用户地域和网络环境的不同,相同Web服务QoS相对于不同的用户可能会差异很大,因此在众多功能相同的Web
随着人们生活水平的不断提高和信息领域的迅速发展,生物特征领域得到人们越来越多的关注和研究。一方面,生物特征比如人脸由于其普遍性,在娱乐方面的应用得到了广泛关注。儿童照
在计算机图形学中雨景的真实感绘制是一项重要的研究课题。雨的模拟可以大大增加场景的真实感,应用领域非常广泛,包括电影、动画、游戏和虚拟现实等领域。然而雨的真实感绘制是
在机器学习领域,特征选择已成为不可或缺的降维方法,尤其是基因数据,特征的维度从几十维到几万维。维度过高不仅会使模型的泛化能力降低,而且对分类时间复杂度有很大的影响。特征
在线事务处理应用面临着并发量和数据量持续增长的挑战,传统的应用服务器集群技术和分布式缓存技术并不能从根本上缓解高并发读写操作对于后台数据库的压力,管理分布式缓存的存
人格代表了一套源自于个体的、稳定的行为模式及内部加工过程,能对人进行有效的人际区分,在心理学研究中有着重要的意义。最常用的人格测量方法是人工填写量表,但由于这一形式耗