可自动调优的高性能稀疏矩阵算法库

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xdzc2009cccc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏矩阵相关算法是典型的非规则算法,也是数值计算领域重要的组成部分,现已被广泛应用到各个领域之中。随着数值计算领域的发展,稀疏矩阵算法库已经成为高性能领域的研究热点。传统的高性能稀疏矩阵算法库受限于兼容性差、并行性差等问题,不能满足大型稀疏数值求解器的要求。  本文实现了一个可自动调优的高性能稀疏矩阵算法库。该算法库支持COO、CSR、DIA、ELL四种稀疏矩阵存储格式,支持CPU、MIC和GPU等计算机体系结构。它提供纯C语言的接口,其中计算接口实现了BLAS标准。本文将自动调优技术引进高性能稀疏矩阵算法库,该技术既可以根据计算机体系结构自动选择最优的算法版本,也可以根据稀疏矩阵的非零元分布特征自动选择最优的稀疏矩阵存储格式。算法库在实现过程中隐藏了存储细节、通信细节和计算机体系结构细节,使得其可以直接运行在异构高性能集群中。算法库针对多个核心算法进行了优化,优化手段包括负载均衡、多线程、SIMD等。  本文以稀疏矩阵向量乘法(SpMV)和稠密矩阵矩阵乘法(GEMM)为例对可自动调优的高性能稀疏矩阵算法库进行了测试。测试结果显示,与串行算法相比,SpMV取得了最高4.x的加速比,与MKL中的SpMV相比,算法库中的SpMV平均获得了1.84的加速比,自动调优技术给SpMV平均带来了了2.29倍的性能提升。对于“瘦高”矩阵,算法库中的GEMM与MKL中的GEMM相比获得了最高10.x的加速比。当进程数量增加到512时,算法库仍然具有一定的扩展性。
其他文献
在过去的几十年里,传统的关系数据库管理系统在商业数据管理中发挥了非常重要的作用。但是,近年来随着计算机应用技术,特别是Web信息技术的不断发展,当今的数据呈现出了两大
在互联网上,大部分服务器郡是因为服务器的配置不当或女装小正确而被攻击,只要修补已知的安全漏洞,就可以抵抗绝大部分的黑客入侵。但是目前很多企业购买的网络安全产品都采
随着日前日益发展的计算机技术和网络技术,信息安全已经成为人们日益关注的热点领域。作为其重要组成部分的信息隐藏检测也进入一个高速发展时期,而对信息隐藏检测的评估也成为
近年来,自然语言处理的研究已经成为热点,而分词与词性标注两个任务作为自然语言研究领域的一个重要分支,同样为大家所关注。分词与词性标注的是自然语言处理的预处理部分,占
如何减小用户使用Web服务的难度,提高对Web服务的使用效率,是当前服务计算相关的一个热点研究问题。现实中,同一类业务需求和同一类Web服务都会存在不同出处的多个版本。如何应
随着信息技术的不断发展,Web上的信息量呈爆炸式的增长。按照蕴含信息的深度,可以将Web划分为Surface Web和Deep Web两大类。在访问模式上Deep Web有别于Surface Web。Surfac
随着网络和存储系统的不断发展,数据集中存储、集中访问、分布处理的使用模式已经成为数据存储的发展趋势。存储集中带来数据访问对共享资源的竞争,导致在大规模并发访问时存储
在医学诊断和治疗的过程中,常常需要对比多幅图像进行分析以获得更精确和全面的信息。图像分析需要多幅图像的几何位置保持一致,即需要对多幅图像进行配准。因此,医学图像配准是
随着互连网的发展,P2P(peer-to-peer)己经成为发展最快的网络应用之一。有关调查表明,P2P业务已悄然占据了互联网业务总量的60%-80%,成为杀手级宽带互联网应用。P2P业务流量
本论文目的是根据部队实弹射击训练的立项需要,研究一套基于机器视觉(图像处理)技术的自动报靶系统。本系统主要目标是实现计算机自动报靶,减少传统射击训练中效率低、安全性