基于OpenCL微测试集的GPU微架构分析与评估

来源 :东南大学 | 被引量 : 0次 | 上传用户:lifei111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们在科学计算、人工智能等领域对大规模数据计算的需求越来越高,使用图形处理器(GPU,Graphic Processing Unit)进行大规模并行计算正逐渐成为学术界和工业界的研究热点。建立一个能够全面反映GPU体系结构的GPGPU量化性能模型,从而评估特定并行算法如何高效映射到特定GPU硬件平台上就显得尤为重要。由于大多数商用嵌入式GPU的微结构参数都不公开,而针对传统GPU的GPGPU性能模型大多基于已知的GPU架构参数,且二者在架构上存在巨大差异,因此传统GPGPU模型无法直接适用于这些嵌入式GPU。  本文旨在提出一种基OpenCL微测试集的嵌入式GPGPU量化性能模型。本文参考传统GPGPU性能模型的主要影响因素及建立过程,设计了一套基于OpenCL的较全面的GPU微架构测试程序集,用于探测模型建立所需要的计算单元数、指令开销、内存结构、访存延迟等微架构参数,作为模型的输入;然后,基于微测试集的测试结果,本文对传统GPGPU程序的主要执行方式,包括计算访存重叠、分支执行等重新进行分析修正,简化了分支执行部分的模型表达;最后,考虑同步语句开销影响,增加同步操作性能建模,使得模型更为准确。在实验部分,论文通过两个常用算子:矩阵乘法和Sobel图像滤波器,在Mali-T628 GPU上来验证所提出模型的有效性。实验结果表明,本文所提出的模型估算的执行时间与实际硬件执行时间相比,准确度最高为86.1%,平均为81.2%,达到预期指标。  相比于传统GPGPU模型研究,本文首次针对未知架构参数的嵌入式GPU进行了架构建模,并证明了模型的有效性,帮助程序员更加高效地在嵌入式GPU上进行GPGPU程序的映射,程序员可以在进行GPGPU算法移植之前,借此评估模型估算GPGPU程序的执行性能。
其他文献
本文通过对荣华二采区10
期刊
金刚石和氧化锌在电学、热学、声学等方面的独特性能,为ZnO/金刚石异质结结构提供了潜在的应用前景,特别是在军事及民用领域的紫外光探测器、通信领域的声表面波(SAW)器件等方
本文研究了光折变自适应光外差探测的关键技术。理论和实验研究了自泵浦、互泵浦以及自泵浦和互泵浦共存相位共轭输出特性与泵浦光入射参数的依赖关系;重点讨论了激光经光学
石墨烯作为一种新颖碳基材料因其具有丰富的电学性质、奇异的量子特性以及广阔的应用前景,成为了近年来理论和实验研究的热点。随着计算机科学计算能力的持续增长,运用基于第一性原理密度泛函理论的计算软件来模拟计算石墨烯己成为科学研究石墨烯的重要手段。本文采用基于密度泛函理论的Vienna Ab-initio Software Package (VASP)对石墨烯结构的电学性质和磁学性质进行了研究。本文主要研
Tet家族蛋白是一种DNA双加氧酶(dioxygenase),可氧化5-甲基胞嘧啶(5mC),被认为在基因去甲基化和基因转录激活中发挥着重要的作用,从而成为表观遗传领域的新热点。Tet家族蛋白有T
水生丝孢菌是淡水真菌的主要类群之一,广义的水生丝孢菌是指整个生活史或生活史的部分阶段依赖水环境的丝孢菌类,分类学上属于子囊菌和担子菌的无性型,包括只分布在水生环境中的
本文通过对荣华二采区10
期刊
学位
本文中电磁干扰抑制措施提高了产品抗干扰能力,减小了生产线上产品的失效损伤,从而降低了由于电磁干扰引起的损失。首先根据磁记录磁头静电放电(Electro-Static Discharge, ESD)损伤试验,利用肖特基势垒二极管(SchottkyBarrier Diode, SBD)进行防护,同时对磁头折片组合(Head Gimbal Assembly,HGA)软线路(Flex Printed Ci
本文主要研究了基于光谱维平滑技术的高光谱遥感图像亚像素目标检测NSAR-NPAMF算法。首先,介绍了几种典型的高光谱遥感图像全像素目标检测方法和亚像素目标检测方法以及基于非稳态自回归模型的归一化参数自适应匹配滤波法(NSAR-NPAMF)。其次,在分析了Kelly、AMF、ACE等典型的高光谱遥感图像亚像素目标检测算法在实际应用中的局限性以及高光谱遥感图像数据光谱维存在的影响算法检测结果的因素的基