可重构流加速器设计研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zyj16812
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算对科学技术的进步、经济社会的发展起着不可估量的作用,除对性能的追求以外,高能效在高性能计算领域也受到越来越多的重视。面向应用的定制计算是提高计算效能的有效手段,但同时通用性却是高性能计算产业化和可用性的基础,在通用计算平台上快速构建高效能的计算机系统成为科学家们面临的挑战之一。  异构加速器模式和面向应用领域的定制计算已经成为了高性能计算系统的发展趋势,FPGA等可重构处理器具备通用处理器的低成本和电路可编程的定制能力,为定制计算提供了便利。  本文系统地研究了面向流式应用的可重构加速器的设计问题,提出采用动态重构和异构多核相结合的加速器结构和设计方法,包括可重构加速器的微体系结构设计、基于调度的异构多核加速器设计空间搜索、以及加速器的编程模型。本文研发了一种基于FPGA的可重构加速卡,并重点研究了生物信息学中具有不同计算特征的两个典型应用:计算密集型的冷冻电镜图像三维重构和数据与访存密集型的基因序列回贴,通过这两个应用的加速器实现验证了所提出的可重构加速器设计方法的有效性。  本文主要的研究成果如下:  1.提出了一种面向流式应用的动态可重构异构多核加速器体系结构框架,设计并实现了加速卡的软硬件原型系统。  2.提出了一种遗传算法和状态空间遍历相结合的动态可重构异构多核加速器设计空间搜索方法。该方法综合考虑异构处理核选择和核间通信缓存分配,以系统吞吐率最大为目标,获得资源分配方案和静态调度序列。  3.提出了一种采用线程串行化来实现细粒度数据并行在动态可重构异构多核加速器上的映射,设计并实现了可重构加速器对OpenCL编程模型的支持。  4.针对生物信息学领域的冷冻电镜图像三维重构应用EMAN和基因序列回贴应用PerM,设计并实现了动态可重构的异构多核加速器结构,其中在PerM的加速器设计中所提出的可动态重组多簇阵列结构具有创新性。EMAN与通用四核Xeon E5520处理器相比,可以达到2-4倍的加速比,而PerM与8核Xeon X7550相比,可以达到20-40倍的加速比。
其他文献
空间科学是指利用航天器研究发生在日地空间、行星际空间及至整个宇宙空间的物理、天文、化学和生命等自然现象及其规律的科学。一直以来,太阳的活动对地球有显著的影响,日冕物
网页关键信息抽取是指从网页中抽取关键信息。关键信息是该网页区别于其他网页的信息。网页关键信息抽取在信息检索、辅助移动设备用户浏览、网络数据分析等方面有非常广泛的
随着互联网技术和视频技术的发展,网络视频的数量呈现出爆炸式的增长速度。台标作为网络视频的一个最显著标志之一,对于视频检索、视频监管均具有重要的应用价值,同时视频台标检
随着通信技术的快速发展,视频的传输和扩散越来越便捷。随之而来的版权保护问题也得到了越来越多的关注。视频水印就是常见的.有效的版权保护方法。为了能够有效的保护版权,
计算机内存系统是影响体系结构、系统软件和应用软件效能的最重要因素之一。过去几十年,由于处理器与内存之间的性能差距越来越大,内存系统已成为制约系统性能的瓶颈。近几年,高
学位
随着web和社交网络的兴起,图计算相关的应用已经成为计算机领域的一个热点。为图计算提供数据存储服务和查询服务的图数据存储系统,在面对社交网络这种大规模数据集时,也正遭遇
随着网络的持续发展,数据量以惊人的速度增长,冗余信息大量存在,同时数据间存在着复杂的关联关系。这使得现有的排序方法中面临着三个问题:信息冗余影响排序结果、将异质关联关
学位
深度学习是机器学习领域中比较新兴的方向,很多研究者相信通过对它的研究,可以达到机器学习的一个本质目的——人工智能。本文主要研究了如何将深度学习应用于行人重现检测技术