基于超长指令字的全局无环指令调度和复数乘法优化设计

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:pbsiszx1234567
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
BWDSP100是一款采用了超长指令字体系结构(VLIW)以及单指令多数据流(SIMD)技术相结合的32bit浮点数字信号处理器(DSP)。它是由中国电子科技集团某研究所自主设计、自主研发,拥有完全自主知识产权。它是主要运用在图像处理、精确制导等高性能计算领域的高端DSP。由于采用VLIW和SIMD相结合技术,因此并行计算能力非常强大,可以满足实时高速信号处理的应用要求。   我们在编译基础设施Openimpact的基础上开发BWDSP100的C语言编译器。编译器把源程序处理成由控制块组成的控制流图。Openimpact编译器的调度器分别调度每个控制块,但是没有跨越控制块的边界调度指令。控制块通常体积很小,也就是块中的指令数目比较少,这样潜在的指令级并行度(ILP)很小。然而BWDSP100处理器所包含的资源是很丰富的。指令调度只有跨越控制块的边界才能够充分发挥处理器多资源的特点,才能充分挖掘出程序中固有的并行性。本文提出了基于超长指令字的全局无环指令调度算法,采用顺序调度和基于编译制导的分支调度相结合的方法改进Openimpact原有的局部指令调度算法。基本思想就是保持原有的数据相关和控制相关的前提下,在循环体的多个控制块间移动指令,合并控制块,扩大那些执行频率比较高的控制块体积来减少整体的执行时钟周期。实验结果显示,该算法可以有效的减少不同点数下的fft_radix2、fft_radix4和fir_real以及fir_cplx程序的执行时钟周期。   图像处理中经常要做快速傅里叶变换(fft)运算,而fft运算包含了大量的浮点复数乘法运算。fft程序的执行时间很大程度上取决于复数乘法运算的执行时间。本文提出了基于编译制导的复数乘法优化模块,该模块由指令移动,指令识别,指令替换三个子模块构成。通过传递编译制导命令,使得Openimpact在控制块中移动相关指令,并运用识别算法,识别出与复数乘法运算相关的所有指令,最后替换其中所有的乘法指令为单条复数乘法指令。实验结果证明,该优化模块有效地缩短不同点数下的fft_radix2和fft_radix4程序的执行周期。
其他文献
传统作业车间调度问题的拓展是多目标柔性车间调度,多目标柔性车间调度更符合现在车间的实际生产情况,对该问题的研究具有现实意义。本文依托宁夏某仪表制造有限公司为背景,该企业是一家离散型制造阀门的企业,实现的是多品种、少批量、多批次的符合现代市场动态的生产方式,企业生产通常受到多个方面的因素的限制。在满足客户需求的情况下我们从企业生产实际出发,抽取出企业需满足的三个目标函数,分别是企业最大利益下的最小机
受到云计算技术快速发展的驱动,虚拟化环境在数据中心中变得越来越普遍,应用的也越来越广泛。数据中心中虚拟机上运行的很多应用都会有大量的通信请求,因此对虚拟机之间的通信效
在实时数据库系统VegeBam2.0的系统架构内,开发了具有通用数据访问接口的实时数据库系统VegeBam2.1。主要内容如下:研究了现有工业控制系统中组态软件的应用和OPC标准的推广情
近年来,随着因特网的快速普及,网络视频服务已几乎渗透到全世界的各个领域,给人们的生活带来极大的便利,但是视频的压缩编码与网络传输会对视频造成不同程度的失真,因此建立起一套
图像情感语义领域的研究起步相对较晚,所涉及的学科非常广泛,包括心理学、计算机科学、社会科学等等,具有非常大的发展空间和潜力。情感语义作为一种重要的高层语义,在语义图
人口老龄化进程的加快,心脏病及心血管疾病在中青年人群中的肆虐和衍生,人们对医疗保健的要求日益增强。随着信息技术及移动互联网的进步与发展,以家庭为中心的医疗模式正在
近几年,基于位置服务(LBS)的广泛应用使得位置定位成为普适计算中一个重要的研究领域。基于位置指纹的WIFI定位技术由于定位成本低、依赖部署的WIFI环境、定位原理简单、实用
随着云计算技术的飞速发展,大规模云数据中心所带来的巨大能耗问题日益凸显。如何有效的降低云数据中心的能耗,成为学术界和商业界关注的焦点。目前云计算数据中心在节能优化研
纱线检测是评价纱线质量的重要方法之一。当前我国检测纱线疵点的方法主要有测长称重法、人工检查法和设备检测法,但这些方法都有不同的优缺点。在纺织行业,增加产品产量的同时
不同的算法可能用不同的时间、空间或效率来完成同样的任务,对于精心实现的算法,往往可以带来更高的运行和存储上的效率。所以研究第一类样条权函数的算法复杂度是非常有意义的