面向CUDA程序的性能预测框架

来源 :电子学报 | 被引量 : 0次 | 上传用户:jordanfandemin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为对CUDA并行程序内核性能进行分析和预测,从而指导并行程序设计及性能优化,提出一种性能预测框架.1)从GPU编程模型和设备架构细节入手,以线程束为研究单位,通过整合与GPU程序用时密切相关的软硬件基本特征,定义了并行空间闲置度、流处理器线程束负载、并行效应因子等高层次性能相关特征.2)基于上述特征,框架针对线程负载均衡型GPU程序,评估内核函数在不同问题规模以及执行配置下的执行时间.3)依据性能评估原理提出了内核函数执行配置参数的优化策略.验证实验结果表明,该框架在两种典型情境下对现有程序性能的平均预测
其他文献
大数据分布式存储系统中,修复流水线(Repair Pipelining,RP)减少90%的修复时间,有效地解决由于修复时间开销较大,纠删码不适用于存储热数据的问题.然而,现有的RP存在节点负载
大量研究表明,microRNA(miRNA)在人类复杂疾病研究中发挥着重要作用.识别miRNA与疾病之间的关系对于提高复杂疾病的治疗水平具有重要意义.然而,传统实验方式常受限于小规模和
针对多目标跟踪中的传感器控制问题,本文基于有限集统计(FISST)理论,利用高斯混合多伯努利滤波器研究并提出相应的传感器控制策略.首先,文中给出容积卡尔曼高斯混合势均衡多
任务切换实验是评估人类认知灵活性的有效范式,其中提示语切换实验(Task Cuing)能够有效地测量任务切换的认知过程.为了深入研究任务切换的认知过程,本文设计了提示语(cue)和