论文部分内容阅读
随着移动通信技术的发展,人们对移动互联网的需求越发多样化,虚拟现实和增强现实等应用需求的出现使得移动互联网络的流量规模爆炸式增长;另一方面,物联网的出现改变了人们对通信服务范围的定义,海量的、多种多样的物联网设备使得网络节点数显著增加,网络结构多样且复杂。基于移动互联网和物联网这两大驱动力,第5代移动通信技术得以飞速发展,以满足人们高速、绿色、泛在、智能的通信需求。大规模多输入多输出(MIMO)无线通信是未来通信的关键使能技术,利用空间维度大大提升了系统的分集或复用增益,能够显著增加系统容量,提升系统能效。然而,大规模的天线阵列使得信号处理的数据规模激增,信号处理的复杂度超出了可接受范围。因此,基于低复杂度近似计算的信号处理算法成为大规模MIMO技术研究的一个重要方向。矩阵逆计算是信道估计、信号检测、预编码等信号处理算法的关键计算步骤,本文基于大规模MIMO系统信号检测和预编码算法中运算矩阵的特点,提出了低复杂度高精度的近似迭代矩阵逆算法,并根据算法的特征,基于FPGA设计了相应的硬件加速单元。由于信号检测和预编码同属于干扰消除技术,只是应用位置不同,且形式具有对偶性,因此本文主要以信号检测为例进行说明。本文的主要贡献包括以下几个方面: 1. 提出在大规模MIMO数据检测中采用基于牛顿迭代(NI)的矩阵逆方法。为了进一步平衡精度与计算复杂度,我们还提出了基于对角带牛顿迭代(DBNI)的近似矩阵逆算法。与多项式扩展(PE)方法相比,NI方法收敛速度快,且迭代次数越多,NI方法的精度提升越快,同时NI方法每次迭代的计算复杂度恒定,因此其计算效率随着迭代次数的增加也越来越高;而对于DBNI方法,它可以在计算复杂度保持O(M2)量级的情况下,获得更高的精度,在精度和复杂度间取得良好的平衡。另外,我们的方法适用范围更广,可以用在基站天线数与用户数比值较小的情况,而PE方法则会在小比值情况下遇到误差平层。除此之外,NI方法和DBNI方法非常适合基于迭代的联合信道估计、检测和译码算法,可以在大规模MIMO系统中以较低的复杂度获得较高的性能。 2. 提出了基于迭代加工(IR)的近似迭代检测或预编码方法。我们讨论了多种近似迭代检测或预编码方法,并详细分析了其计算复杂度。然后我们利用IR方法对这几种近似迭代方法进行改进,称这种改进后的方法为基于IR的近似迭代方法,该方法本质上是三种近似迭代方法的结合。我们比较了基于IR的近似迭代方法和四种近期提出的近似迭代方法,在SELF模式下其归一化均方误差分别降低了27%、44%、67%和83%,这一性能提升不需要任何额外硬件资源,并且仅需要极小的复杂度开销。接下来我们以NI和DBNI为例,在硬判决译码系统中更细致地分析了IR方法的改进效果。最后,我们进一步分析了近似迭代检测结合软输入软输出Viterbi译码系统的误码率性能。 3. 设计了基于牛顿迭代法的大规模MIMO矩阵逆硬件加速器,提出了阵列结构和迭代结构两种设计框架。为了平衡硬件开销和计算精度,我们利用Matlab进行了设计参数模拟,选择了最佳的定点设计位宽参数。然后,基于提出的设计框架和设计参数,我们设计了NI矩阵逆硬件加速器的基本模块NI_4x4,并以160 × 8规模的天线检测任务为例,分别介绍了阵列结构的NI_8x8设计和迭代结构的NI_iter的任务划分与调度方法。最后我们将NI矩阵逆硬件加速器与PE矩阵逆硬件加速器进行了比较,对于阵列结构,其设计灵活性高,可以支持多次迭代实现高精度计算,即使相较于改进的PE结构,在更高的精度要求下,基于NI的设计也可以获得更小的延时,更高的吞吐率;对于迭代结构,它进一步增加了设计的灵活性,在任务规模小于计算单元阵列规模时,效果与阵列结构一致,当执行大规模任务时,NI_iter可以通过划分调度支持超硬件规模的任务,并利用酉对称特性优化计算过程,显著缩短执行延时。 4. 我们设计了大规模MIMO条件下基于DBNI方法的矩阵逆硬件加速器,提出了阵列结构和迭代结构两种设计框架并重点介绍了迭代结构。综合考虑硬件开销和计算精度,我们利用Matlab进行了设计参数模拟,选择了最佳的定点设计位宽参数。然后,基于迭代结构设计框架和设计参数,我们设计了DBNI矩阵逆硬件加速器DBNI_iter的基本模块Gram_4x4和DBNIINV_4x5。接下来,我们提出了DBNI_iter的任务划分、调度方法,并定制了相应的控制单元。最后我们将DBNI_iter与PE矩阵逆硬件加速器和NI_iter进行了比较,实验结果显示,DBNI_iter比PE结构拥有更高的频率,更少的资源开销,且能支持超硬件规模的计算任务,适合于计算资源紧张、任务规模动态变化的应用场景;而与NI_iter相比,DBNI_iter充分利用算法特征,降低了各计算模块的计算延时,并且通过解耦Gram计算与迭代求逆过程,显著提升了系统的吞吐率。 综上所述,本文对大规模MIMO系统中的近似迭代检测或预编码算法进行了深入研究,并针对算法特征设计了高性能、高灵活性的专用硬件加速器,为推动大规模MIMO系统基带信号处理器的实用化奠定了基础。