论文部分内容阅读
随着现代通信技术的发展,电话会议系统、车载免持电话和VoIP等通信系统不断涌现,并且随着智能可穿戴设备、智能车载和智能家居等领域兴起,越来越多的设备具有语音交互功能。不同于传统的语音通信系统,这些系统需要满足用户在“远讲”情况下实现语音通信或交互的需求。在一般化的“远讲”应用场景中,由于目标距离传声器的距离通常较远,目标语音容易受到混响、声学回声和环境噪声等信号的干扰,为了提升语音信号质量,实际中多采用传声器阵列进行拾音,使得传声器阵列语音增强技术研究成为一个重要课题。阵列语音增强技术通常需要解决以下几个方面的问题:首先,说话人的声音经过墙面、地板等的反射产生的混响会影响语音交互系统中自动语音识别引擎的识别率;其次,语音通信或交互系统产生的声学回声会影响用户体验;再者,由于目标说话人距离传声器较远,环境中的扩散噪声或非目标说话人的干扰声不可忽略,这就要求增强算法具有相对于“近讲”来说更好的扩散噪声和方向性干扰抑制能力。本文主要对阵列语音增强中的声学回声消除、扩散噪声及方向性干扰源的抑制进行研究。主要研究工作及创新点包括: 1.对声学回声消除的核心部分——自适应滤波算法进行深入研究。 (1)提出一种基于鲁棒统计量和成比例更新的变步长自适应滤波算法。新算法以最小化每个频点上的后验误差为准则,对滤波器系数每次迭代的更新量加以限制,具有较快的收敛速度和较好的近端干扰鲁棒性。同时,我们将提出的算法扩展到分块频域自适应滤波框架中,能够满足实际应用中的低延时的需求。 (2)提出一种基于Huber M-估计子和分界点更新的仿射投影自适应滤波算法。与归一化最小均方误差算法相比,仿射投影算法具有更快的收敛速度,但是其稳态误差更大。新算法通过对经典仿射投影算法的目标函数进行修饰,对目标函数施加Huber M-估计子,并且对修饰后目标函数的分界点进行自适应更新,在保持算法较快收敛性能的前提下,有效较低了算法的稳态误差。 (3)提出一种改进的基于卡尔曼滤波的回声消除算法。卡尔曼滤波在解决系统辨识问题时具有很好的性能,因而近年来被引入到声学回声消除问题中。对卡尔曼滤波算法来说,其系统不确定量的控制对算法性能有着至关重要的影响,本文提出一种基于残余回声估计的系统不确定量计算方法,有效改善了传统卡尔曼滤波在回声消除应用中对近端干扰不够鲁棒的问题。 2.对多通道噪声抑制算法进行研究,提出一种多通道维纳滤波参数优化方法。参数化的多通道维纳滤波算法是多通道噪声抑制的一个研究热点,本文提出一种目标降噪量导向的参数优化方法,能够自适应地平衡降噪性能和语音保真效果。同时,我们指出部分传统算法均可以由本文提出的算法导出,因而具有重要的理论意义和实践价值。 3.针对方向性干扰源抑制问题,对波束形成算法进行研究。 (1)提出一种基于目标参考比和贝叶斯框架的可变对角加载波束形成算法。基于对角加载的波束形成算法计算量小,对较小的导向矢量误差不敏感,但是对较大的导向矢量误差不够鲁棒。本文提出基于目标参考比的可变对角加载波束形成算法,改善了固定对角加载波束形成算法的鲁棒性,并且新算法引入了贝叶斯框架,提升了算法对较大的导向矢量误差的鲁棒性。 (2)提出一种基于两阶段导向矢量估计的波束形成算法。现有的基于导向矢量估计的波束形成算法通常需要凸优化工具箱求解,计算量较大。新算法将导向矢量估计分为两个阶段,第一阶段假设目标导向矢量可以表示为某正交子空间特征向量的线性组合,通过最大化估计的导向矢量和目标导向矢量的相关性求得估计的导向矢量在该正交子空间下的坐标。第二阶段结合传统的鲁棒Capon波束形成算法,得到最终的导向矢量估计。新算法跟传统算法相比计算量相当,但是无需凸优化工具箱求解,更为方便。 (3)提出一种基于空间预判决的双传声器波束形成及后滤波算法。实际传声器阵列增强应用中,受硬件和计算资源所限,多采用双传声器解决方案。新算法通过最大化输出信噪比求取滤波器系数,并采用基于相位差的空间预判决指导目标和干扰协方差矩阵的估计,结合后滤波方法,能够获得较好的方向性干扰抑制效果。