论文部分内容阅读
DSP作为嵌入式系统的核心部件,广泛地应于智能终端、通信设备、多媒体处理等领域。应用需求的不断发展,要求DSP具有更高的性能、更低的功耗、良好的可调试性、更快的验证速度。因此,本文在循环优化、数据预取、流水线优化、片上调试和处理器验证等方面进行了相关研究,并在该研究基础上开展了高性能、低功耗嵌入式DSP芯片——SuperV_EF01的设计与验证工作。 本论文面向高性能低功耗的循环优化技术、数据预取技术、流水线优化技术、片上调试与快速验证方法开展了相关的研究工作。 在循环执行性能优化技术方面,本论文提出了一种软硬件协同的循环优化方法。通过编译器搜索循环,插入循环标志指令并删除循环开销指令,硬件上增加专用的循环控制单元,实现循环计数器的增减和取指地址的计算等功能,从而达到零开销循环的目的,提升了循环的执行性能。 为了降低循环的取指功耗,本论文提出了一种基于指令缓冲的动态低功耗循环缓冲方法,在指令缓冲区中动态开辟循环缓冲空间,并正确控制两个区域的工作模式,有效降低了循环的取指次数和取指功耗。 在数据预取技术方面,本论文提出了一种软硬件协同的数据预取调度方法。通过数据流扫描、关键指令识别、DMA控制来选择性启动数据预取,有针对性地对缺失的数据进行预取。添加专用的数据预取Cache用于存放预取的数据,有效地减少了数据访问的缺失次数和流水线停顿周期,减缓了“存储墙”的问题。 在流水线优化技术方面,本论文提出了一种基于指令缓冲的两段式流水线设计方法,通过添加指令缓冲,将流水线分隔成取指和执行两部分,既增加了代码密度又降低了由存储器访问阻塞导致的流水线停顿,提高了流水线的效率。 为了增加子函数调用类分支延迟槽调度的灵活性,本论文提出了一种子函数调用类分支的优化方法,在该类分支指令中标识延迟槽内的指令数目,实现了该类分支指令延迟槽的灵活调度。 在片上调试技术方面,本论文设计了一套可复用的调试指令集并给出了调试模块的设计方案和微处理器内核的修改方案,实现了多种微处理器片上调试功能,方便软件开发与系统调试。 为了加速处理器的验证过程,本论文提出了一种基于ESL模型的处理器验证加速方法,通过搭建比较粒度可调节的自动化验证平台,实现了快速正确性检查和精确错误定位。