【摘 要】
:
基于超长指令字的DSP一般都具有多条指令同时发射、多个功能部件同时执行的特点,要求寄存器文件具备多个读写端口以满足功能部件对寄存器文件的同时访问。提高性能、降低功耗
论文部分内容阅读
基于超长指令字的DSP一般都具有多条指令同时发射、多个功能部件同时执行的特点,要求寄存器文件具备多个读写端口以满足功能部件对寄存器文件的同时访问。提高性能、降低功耗、减小面积是多端口寄存器文件设计的关键。本文根据XDSP的结构确定了寄存器文件的设计要求,对多端口寄存器文件的全定制设计和实现技术进行了研究。本文的主要工作和贡献集中体现在以下几个方面:对结构和电路进行优化,提高了寄存器的性能。把读寄存器、运算、写回安排在不同的流水站中,缩短了关键路径。利用时钟偏斜进行了优化,用正向时钟偏斜来提高电路性能。存储内核采用动态读电路和静态推拉结构的写电路来提高读写速度,译码器采用两级静态译码结构并用基于逻辑努力的方法进行优化,减少了11.1%的译码时间。定向通路中使用了低阈值技术把延时降低了27.3%。采用门控时钟、多阈值技术、反相读出、多级译码、动静转换等技术降低功耗。所有端口同时工作读端口都读全1时的功耗最大,为52mW,小于同等规模的寄存器文件。采用端口复用技术减少了版图面积。根据长型数据访问的特点采用了端口复用分体布局技术,将存储阵列中端口数目和译码器数目减少了7个,并完成了与端口复用相关的模块设计,使得寄存器面积最终减少了19%。对更多端口的寄存器文件进行了研究,讨论了端口数目的增加对存储内核性能的影响,提出了一种改进的字线共享存储内核结构,使得读写延时随端口数目的增长率分别减少了32.9%和4.9%。本文在0.13μm工艺下完成了一个具有13个读端口9个写端口,容量为32×32位、能够在单周期内完成数据写入并读出、含有定向通路的寄存器文件。该寄存器文件在X高频DSP数字信号处理器中流片,频率可以达到625MHz。
其他文献
层叠滤波器是一种具有层叠性和阈值分解性的滑动窗非线性数字滤波器,在传统阈值分解的基础上,又提出了基于镜像阈值分解的镜像阈值层叠滤波器。层叠滤波器的研究使人们可以从
中小学美术新课程改革在我国的教育改革发展史上具有重要的地位,它的实施与发展直接关系着我国中小学美术教育的教学质量,随着美术新课程改革的不断发展,基础美术教育理念随之
发现、发掘与发展学生的领袖潜质,积极探索培养学生领导力的途径,是创新人才培养的重要组成部分。培养中学生的领导力是信息时代的呼唤,也是青少年发展的需要,更是实现教育公
本论文采用中芯国际0.18μm混合信号CMOS工艺库设计了一种12位分段电流舵结构D/A转换器IP核。采用5+3+4的分段方式,高五位和中间三位分别采用温度计码加权电流源结构,经过列
随着现场可编程逻辑门阵列(FPGA)在功能、密度、速度上的不断提升和成本的降低,使得它的应用越来越广泛。同时FPGA结构也越来越复杂多变,这就要求其电子设计自动化(EDA)系统
社会经济发展带动了交通行业改革进步,地铁是新城市交通的重要枢纽,其改变了传统的地面交通模式,将交通线路引入地面以下,开辟了现代交通运行的新方式。除了交通方面的应用价
遗传算法是仿真遗传学和自然选择机理构造的一种搜索算法,因其对优化问题的弱依赖性、求解的非线性和鲁棒性、隐含并行性等特点被广泛应用于当前的各个领域。本文通过对遗传
高速公路运输作为交通运输的一个重要组成部分,是我国国民经济发展的大动脉之一,因其高速方便等有利因素,越来越受到人们的欢迎.但是,由于驾驶员违反交通规则、车辆维护不及时等诸
通过分析小组式合作学习的理论基础以及将其引进高中英语课堂中的现实意义,介绍小组式合作学习在课堂中的多种表现形式,并且从实际的教学情境出发,论述了小组式合作学习在高
新课程倡导建立自主合作探究的新型学习方式,这对传统的以教师讲授为主的课堂教学模式产生了强烈的冲击,如何使新课程背景下的这一新型学习方式得到有效的落实,使学生逐步养