论文部分内容阅读
在现代无线通信系统中,为了充分利用日益稀缺的频谱资源,OFDM技术成为了宽带无线通信系统中的主流技术,被多种无线通信标准所采用。中国的数字多媒体/电视广播标准(DMBT),采用了与传统OFDM技术不同的时域同步正交频分复用系统(TDS-OFDM)。TDS-OFDM系统中用PN序列填充OFDM符号间的保护间隔,无需在频域插入导频信号,进一步提高了频谱的利用率。其信号帧的子载波数目为3780个,系统中多载波的调制与解调使用3780点FFT/IFFT处理器实现。作为TDS-OFDM系统中不可或缺的关键模块之一,针对3780点FFT处理器的算法、结构以及硬件实现方法的研究具有重要的理论和现实意义。论文对目前主要的FFT算法及其硬件实现结构进行了详细的研究,分析和推导了各种算法的分解过程,比较了其算法复杂度和适用范围;在FFT处理器的硬件实现结构方面,论文对目前主要的两种硬件实现方式——存储器结构和流水线结构进行了讨论和对比。论文分析和总结了已有的3780点FFT处理器的实现方法,在此基础上,对以下几个方面进行了深入的研究与优化:1.算法上,综合运用了库利-图基与古德-托马斯两种混合基算法,采用质数因子优先的逐级分解方式,降低了FFT处理器中需要存储的旋转因子数量;结构上,基于一般混合基的存储器分块策略,得到了一种适用于3780点FFT的存储器分配和地址生成机制,避免了FFT运算过程中同时读写多个存储器块的冲突问题。2.针对实时计算中连续数据帧的处理要求,论文提出了一种新的输入输出地址映射方式,通过改变最后三级FFT的计算组合顺序,高效地实现了输入和输出过程中的原位运算以及连续流的数据处理。3.针对FFT处理器中的运算单元,论文提出了一种复用两路3点、4点、5点和7点WFTA算法的运算单元结构,在降低处理器的硬件消耗的同时提高了数据并行度,降低了FFT的计算周期。4.论文对旋转因子乘法单元进行了优化研究,提出了一种改进的高基CORDIC算法,在减少传统CORDIC算法的迭代次数的同时保持模校正因子为一个常数,基于该算法设计的旋转因子乘法单元相比通用的复数乘法器方案具有更小的硬件面积和更低的存储器消耗。在以上的研究和优化工作的基础上,论文提出了一种3780点FFT处理器基于存储器结构的高效实现方案,详细讨论了该处理器的整体架构以及其中关键模块的设计方法。与已有的实现方法相比,该结构在硬件规模、存储器消耗和计算周期数上具有优势。论文基于Matlab建立了3780点FFT处理器的浮点和定点参考模型,采用Verilog硬件描述语言对所设计的FFT处理器进行了RTL级硬件实现,并且搭建了FPGA硬件仿真与验证平台,对硬件设计进行了功能验证和性能评估。仿真结果表明,论文所设计的3780点FFT处理器很好地满足了TDS-OFDM系统的要求。最后,论文基于TSMC 65nm工艺对所设计的FFT处理器核心进行了综合以及后端版图设计,得到了最终的版图实现结果。