面向AXI接口的高速FFT处理器的设计与实现

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:zdp1888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离散傅立叶DFT变换作为数字信号处理中最基本的运算之一,在很多领域中发挥着重要的作用,而快速傅立叶变换FFT作为DFT的快速算法使得傅立叶变换的运算量大大减少,且实现起来更方便,已成为现代数字信号处理的核心算法之一。所以,对FFT算法及其实现的研究有着极强的理论和现实意义。另外,随着SoC的发展,IP核的复用成为加速SoC设计的重要途径,片上互联也成为一个重要的研究问题。   本文针对龙芯数字信号处理平台,设计实现一个1024点浮点数FFT处理IP核。该口核处理符合IEEE754标准的32位单精度浮点数。采用无冲突的地址生成方案,基-4蝶形,流水处理。接口符合ARM公司提出的AMBA3 AXI标准。   对于FFT运算处理部分,本文提出并实现了三种系统结构,并在性能和资源占用方面对它们做了比较分析。   首先,我们根据浮点数据运算的特点,设计浮点加减法和浮点乘法运算模块,蝶形运算单元采用改进的浮点加减法运算器,而相位旋转运算采用浮点乘法器实现。   第二种方案则是利用了定点运算的简单快速的特点,采用块浮点运算思想,将从内部存储中读取的浮点数据在进行基-4蝶形运算之前进行统一对阶,即4个复数的虚实部共享一个指数,尾数以定点格式参与接下来的蝶形运算和定点CORDIC旋转。在运算之后,将定点尾数规格化还原为IEEE754标准单精度浮点数。   通过分析前两种方案的性能和效果,结合定点运算和浮点运算的特点,我们给出了第三种方案,即蝶形运算部分采用块浮点思想用定点运算实现,而相位旋转部分采用浮点乘法器实现。   仿真结果的统计分析表明,第三种方案比第二种方案的资源占用稍多,但是可以获得和第一种方案相类的精度和性能。因此选用它来作为我们FFT处理部分的实现方案。   在IP核接口方面,为了可以与龙芯数字信号处理平台中的其他IP实现交互,我们根据实际应用,采用Register-in-Combination-out方式定制实现了AXI的Master和Slave接口,并通过了行为仿真验证。
其他文献
多媒体技术和计算机互联网的飞速发展使得人们可以更好地享受各类视频信息,如:有线电视、交互式网络电视、视频监控、视频电话等。为了节约这些视频信息的存储空间及网络传输带
学位
在信息检索系统中由于查询过短和存在歧义等原因,单纯依靠用户自己构造查询往往不能准确地表达搜索意图,导致搜索效果不佳,查询推荐是解决这一问题的关键技术之一。查询推荐技术
党中央、国务院历来高度重视安全生产工作,安全生产不仅关系人民群众的生命财产安全,还关系着改革、发展和稳定的大局。目前,我国经济和社会发展水平决定了我国在一段相当长的时
工业产品的快速开发要求采用“V”字形开发。作为“V”字形开发不可或缺的重要组成部分,快速控制原型能大大缩短产品的开发周期。在线调参是快速控制原型开发的关键技术。在线
当前,蛋白质序列数据库以很快的速度增长,而蛋白质结构测定的实验技术却很慢,因此使用计算方法来预测蛋白质结构成为缩小序列测定和结构测定之间速度鸿沟的重要方法。蛋白质结构
随着网络技术的发展,电子商务渗透到贸易活动的各个阶段包括信息交换、售前售后服务、电子支付、运输等等。电子商务协议就是为了完成电子商务活动而设计的协议。作为一类特殊
学位
随着科技的发展,特别是传感器网络、互联网等技术的广泛应用,数据流出现在越来越多的应用系统中,于是,数据流管理系统的构建、优化等技术得到密切关注。并且,由于应用系统对数据流
随着现代外科手术的发展,手术门类越来越丰富,在手术训练中需要掌握的技巧和知识越来越多,从而导致尸源和实习机会的相对减少,医学院学生在解剖室或手术室中的训练相对不足。另一
随着全球汽车产量的逐年提高,相应地轮毂市场需求也在迅猛增长,国内80%的汽车轮毂是由铸造而成,铸造而成的轮毂需要进行精加工,而由混流生产线生产的轮毂在再加工时若对其类型进行
软件工程发展到今天,仍然有很多因素无法控制。如何有效的保证软件质量仍然是软件工程的重大难题,同时这也是决定项目成功与否的关键因素之一。对软件质量进行量化管理并客观的
学位