论文部分内容阅读
高性能计算对科学技术的进步、经济社会的发展起着不可估量的作用,除对性能的追求以外,高能效在高性能计算领域也受到越来越多的重视。面向应用的定制计算是提高计算效能的有效手段,但同时通用性却是高性能计算产业化和可用性的基础,在通用计算平台上快速构建高效能的计算机系统成为科学家们面临的挑战之一。 异构加速器模式和面向应用领域的定制计算已经成为了高性能计算系统的发展趋势,FPGA等可重构处理器具备通用处理器的低成本和电路可编程的定制能力,为定制计算提供了便利。 本文系统地研究了面向流式应用的可重构加速器的设计问题,提出采用动态重构和异构多核相结合的加速器结构和设计方法,包括可重构加速器的微体系结构设计、基于调度的异构多核加速器设计空间搜索、以及加速器的编程模型。本文研发了一种基于FPGA的可重构加速卡,并重点研究了生物信息学中具有不同计算特征的两个典型应用:计算密集型的冷冻电镜图像三维重构和数据与访存密集型的基因序列回贴,通过这两个应用的加速器实现验证了所提出的可重构加速器设计方法的有效性。 本文主要的研究成果如下: 1.提出了一种面向流式应用的动态可重构异构多核加速器体系结构框架,设计并实现了加速卡的软硬件原型系统。 2.提出了一种遗传算法和状态空间遍历相结合的动态可重构异构多核加速器设计空间搜索方法。该方法综合考虑异构处理核选择和核间通信缓存分配,以系统吞吐率最大为目标,获得资源分配方案和静态调度序列。 3.提出了一种采用线程串行化来实现细粒度数据并行在动态可重构异构多核加速器上的映射,设计并实现了可重构加速器对OpenCL编程模型的支持。 4.针对生物信息学领域的冷冻电镜图像三维重构应用EMAN和基因序列回贴应用PerM,设计并实现了动态可重构的异构多核加速器结构,其中在PerM的加速器设计中所提出的可动态重组多簇阵列结构具有创新性。EMAN与通用四核Xeon E5520处理器相比,可以达到2-4倍的加速比,而PerM与8核Xeon X7550相比,可以达到20-40倍的加速比。