数值计算软件包自适应性能优化若干关键技术及评价标准研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:andyofja
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了能够充分使用计算机资源,使软件运行能够尽可能地接近计算机峰值性能,研究人员一直在努力。一个思路是为计算机开发优秀的编译器,并使用编译器相关技术对软件进行性能优化;作为补充,另一个思路是开发能够共用的核心软件包,通过提高核心软件包中程序的性能提高调用核心库的软件系能。   但科学计算中针对特定的计算机平台和特定的用户问题进行性能调优仍然是一个困难的问题。速度和可移植性是数值计算软件开发中的一对矛盾。自适应性能优化技术正是为了解决数值计算软件中的可移植性问题和进行自动性能优化而提出的,科学家们希望数值计算软件能够动态地获悉计算环境的变化以及待求解问题的特征,根据需要改变自身以适应这些变化以及多种复杂的问题情况,并且在多种求解方法中进行决策以选择最优的解决方法来求解问题。   本文调研了使用自适应性能优化技术的几个著名软件包:ATLAS,SPARSITY,OSKI以及数字信号处理领域的快速傅立叶变换软件包FFTW,在此基础上,重点分析和比较了自适应性能优化的关键技术,着重介绍了矩阵乘计算、MPI通信操作、快速傅立叶变换中涉及的经验搜索、算法选择和自动代码生成等技术在这些软件包中的应用。   在深入调研的基础上,结合实际应用需求,本文还提出了自适应性能优化过程的新的评价指标,试图权衡优化效果和优化时间开销,并在不同的实验平台上针对ATLAS的优化过程进行的实验和过程评价,实验表明,综合优化效果和优化开销能够有效地发现ATLAS自适应优化过程的特征。将其应用到实际开发和调优过程中,能够在不损失性能的前提下,节省优化时间。论文最后对HPCC测试软件包在IBM刀片机群上进行了对比测试,发现了测试平台存在的性能瓶颈,并消除了该瓶颈。表明HPCC软件包确实可以有效的发现被测平台存在的性能瓶颈问题。
其他文献
本文重点对超图划分和空间填充曲线两类方法进行比较研究。在大规模科学计算中,并行计算效率提升的一个关键在于将数据进行剖分,分配到相应处理器中,以及对处理器中的数据进行动
作为一种无需预设设备支持的无线移动网络,移动自组网的研究越来越多地得到人们的关注,特别是对网络性能有重要影响的路由协议的研究。由于移动自组网中的节点采用电池一类的可
软件测试是伴随软件开发全过程的重要活动。测试管理帮助企业制定软件测试流程,管理测试人员,规范测试运行,分析测试结果,是保证软件测试质量的主要手段。   软件测试模型是软
本文介绍了移动计算领域一个较为年轻的新课题——位置相关数据。位置相关数据是一种向移动用户提供即时、即点信息服务的技术。通过位置相关服务用户在移动过程中可以获得与
流程企业生产过程反映了企业的工艺路线、资源配置及其制造能力,生产过程的稳定运行影响着产品生命周期的各个阶段,因此进行生产过程的实时监控非常必要。生产过程中的大量装置
InfiniBand(IB)是I/O技术领域的一种新型体系结构,提供具有低延迟、高带宽特性的RDMA传输方式,为提高集群通信性能提供了支持。当前在Java应用程序中使用构建于InfiniBand网络
推荐系统通过预测用户的信息需求,向用户推荐其需要的资源(商品、电影等)。主流的推荐算法利用用户对资源的评分信息和资源的内容信息进行推荐,但很多应用场景还包含其他重要信息
二元关系框架被证明可以应用在许多日常生活偏好关系处理中。本文提出使用二元关系框架来表示偏好的方法。这里的偏好指的是严格偏序的二元关系。偏好框架可以表示有限偏好关
随着教育信息化工程在全国范围内的迅速推进,迈进信息化大门的教育系统对信息的需求是惊人的,特别是一线教师有了更广阔的学习资源和交流空间,而这些信息主要以网页、电子书、数
普适计算(Pervasive Computing)的出现改变了传统的以计算机为中心的资源和信息获取模式,提出一种以人为本的计算方式,为人们提供随时随地、适应环境变化的资源和信息的获取方