自动调优和模板算法的研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：a176305712

【摘要】

：

高性能计算是当前科学研究的重要手段之一。受到功耗的限制，计算机已经不能通过单纯的提高频率来获得性能的提升。多核成为计算机发展的重要方向，随之而来的复杂体系结构和编程

【作者】

：

骆裕龙

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

自动调优模板算法领域专用语言计算模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

高性能计算是当前科学研究的重要手段之一。受到功耗的限制，计算机已经不能通过单纯的提高频率来获得性能的提升。多核成为计算机发展的重要方向，随之而来的复杂体系结构和编程环境，对科学计算应用带来新的挑战:　　开发效率的低下。由于平台的复杂化，开发人员在开发过程中不仅要考虑应用本身的逻辑，还要根据硬件平台特点，选择相应的编程模型、调整优化算法。　　运行效率很低。高度并发的计算核心很难在运行过程中协同工作并发挥最大效率，未做充分优化的应用在这类系统上往往运行效率很低，大量的硬件资源被浪费。　　移植性很差。由于平台之间体系结构差异巨大，其编程模型和优化算法也随之发生改变。应用在不同平台之间迁移不仅要考虑编程模型/语言的改变，还要承受因为优化方案与平台体系结构特征不匹配带来的性能损失。　　本文针对上述挑战进行研究，主要的创新点主要有:　　提出了一种面向通用领域的自动调优框架。目前自动调优领域的工作缺乏一个基础性的框架，能够帮助自动调优技术开发者快速开发领域专用的自动调优器。我们提出并实现了一个面向通用领域的自动调优框架，该框架根据自动调优的基本步骤抽象了一套基础架构用于快速构建自动调优器。同时，框架还包含了一个统一、可扩展、可自定义的知识数据库用来管理自动调优过程中产生的知识数据。　　提出了一种面向模板算法的领域专用语言。在高性能计算机系统上开发模板算法类应用，用户不仅需要关注应用的本身逻辑，还要考虑性能优化与体系结构之间的关系，这大大降低了开发效率和应用的可移植性。为此，我们针对模板算法领域的抽象特征，设计并实现了一门模板算法的领域专用语言—HPS。此外，我们基于ROSE编译器框架实现了支持HPS的领域专用编译器，同时支持C++/Fortran风格的HPS领域源代码。该编译器根据目标平台类型，把领域源代码映射到CPU和GPU平台，并支持包括分块、循环展开、向量化、多线程、CUDA分块等一系列优化技术。　　提出了一种最优解空间调优算法。模板算法优化策略很多，其优化空间很大，常规的调优算法应用到模板算法领域需要大量的时间开销，阻碍了其应用。我们提出了一个基于最优解空间的自动调优算法，该算法通过预测待优化模板算法的最优解空间，从而使用较小的开销达到优化目标。在调优结果和贪心算法相当的情况下，最优解空间调优算法的速度比贪心算法快10-2697倍，时间开销平均降低了2个数量级。　　提出了一种计算局部性模型。模板算法中的大量优化算法都是用于访存优化，它们都是基于（访存）局部性理论发展而来的。相对于访存优化，计算优化缺乏一个模型用于指导。我们提出了一种计算局部性模型，用于量化模板算法中的计算和分析计算在模板算法应用运行过程中的两个局部性现象—计算的空间局部性和计算的时间局部性。此外，我们还提出并实现了针对模板算法中计算空间局部性的冗余计算消除算法(Redunant Computation Elimination，RCE)。

其他文献

二维矩形装箱问题研究及其在图集排版中的应用

二维矩形装箱问题(2-DimensionalRectangularPackingProblem，2DR-PP)属于典型的组合优化问题，在工业领域有着广泛的应用，如新闻组版、布料切割、金属下料等。理论上，该问题属于NP

学位

矩形装图集排版组合优化混合算法遗传算法

开放式P2P存储平台Upstore的设计与实现

P2P存储系统具有可扩展性好，容错性高等优势，是近年来学术界的研究热点。但是由于P2P存储系统的复杂性高，搭建起来比较困难，使得系统并没有随着研究发展而流行起来。尤其是在广域

学位

存储系统广域网机房系统存储网络对等网络存储平台

三维人体建模中的点云孔洞修补

三维人体建模在服装定制、虚拟现实、电子游戏、影视特效等领域中具有重要的应用价值。在基于立体视觉的三维人体模型重建过程中，由于相机视角与遮挡等原因，获取到的点云数据往

学位

三维人体建模孔洞修补三维重建点云迭代排斥模板变形

中文网页中人物实体的指代消解技术及其实现研究

指代是自然语言中常见的语言现象，大量出现在日常对话和书面记录中。由于互联网技术的不断发展，Web上出现了数以万记的网页，这些网页的内容大多是以自然语言的形式描述的，其中包

学位

中文网页指代消解自然语言信息抽取内容挖掘

三维片上网络的可靠路由方法研究

随着集成电路制造工艺的进步和半导体技术的发展，传统的二维芯片的设计越来越复杂，通信成本不断提高。三维集成技术缩短了物理连线的长度，降低了系统的通信时延和功耗，成为芯片架

学位

三维片上网络拓扑结构转向模型永久性故障路由方法通信可靠性

基于数据挖掘和机器学习方法的网络异常检测技术研究

随着互联网的飞速发展以及网络应用服务越来越呈现出的多样化和多元化等特点，网络协议、网络基础设施以及网络服务存在的相关缺陷和问题为黑客所利用，网络攻击正趋日益增长之势

学位

网络安全网络异常检测数据挖掘机器学习

一种动态生成可定制web页面的方法及其应用

由于Web应用系统具有层次分明，可移植性好，管理灵活的特点，Web应用软件己成为当前软件系统开发的主流，同时，Web应用软件由产品向服务的转型是Web应用软件发展的必然趋势，针对用户对

学位

Web应用软件系统页面生成web页面

软件体系结构协同设计支持工具的设计与实现

随着软件开发的全球化发展，地理上分散的开发人员之间的协同工作在软件开发中所占的地位越来越重要，协同软件工程也因此成为软件开发领域的热门研究方向。软件工程领域的协同的

学位

软件开发体系结构协同设计支持Eclipse插件模型比较机制

基于网关的无线Mesh网络组播路由架构及算法

无线Mesh网络(Wireless Mesh Networks，WMN)作为一种无线多跳的组网方式有着广阔的应用前景。WMN具有高带宽、覆盖范围广以及部署成本低等特点，用户可以不依赖于现有的网络基础

学位

无线Mesh网络组播路由算法体系架构通信效率GAMER设计

基于文本词性与位置过滤的网页排名技术研究与实现

随着Web的快速发展和Web信息的爆炸式增长，越来越多的Web用户使用搜索引擎来寻找想要的信息，搜索引擎也就扮演着越来越重要的角色。为了能将更好的搜索结果提供给用户，大部分搜

学位

文本词性网页排名位置过滤Web信息搜索引擎链接分析算法

自动调优和模板算法的研究

其他学术论文