传声器阵列语音增强若干关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:fengliguo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代通信技术的发展,电话会议系统、车载免持电话和VoIP等通信系统不断涌现,并且随着智能可穿戴设备、智能车载和智能家居等领域兴起,越来越多的设备具有语音交互功能。不同于传统的语音通信系统,这些系统需要满足用户在“远讲”情况下实现语音通信或交互的需求。在一般化的“远讲”应用场景中,由于目标距离传声器的距离通常较远,目标语音容易受到混响、声学回声和环境噪声等信号的干扰,为了提升语音信号质量,实际中多采用传声器阵列进行拾音,使得传声器阵列语音增强技术研究成为一个重要课题。阵列语音增强技术通常需要解决以下几个方面的问题:首先,说话人的声音经过墙面、地板等的反射产生的混响会影响语音交互系统中自动语音识别引擎的识别率;其次,语音通信或交互系统产生的声学回声会影响用户体验;再者,由于目标说话人距离传声器较远,环境中的扩散噪声或非目标说话人的干扰声不可忽略,这就要求增强算法具有相对于“近讲”来说更好的扩散噪声和方向性干扰抑制能力。本文主要对阵列语音增强中的声学回声消除、扩散噪声及方向性干扰源的抑制进行研究。主要研究工作及创新点包括:  1.对声学回声消除的核心部分——自适应滤波算法进行深入研究。  (1)提出一种基于鲁棒统计量和成比例更新的变步长自适应滤波算法。新算法以最小化每个频点上的后验误差为准则,对滤波器系数每次迭代的更新量加以限制,具有较快的收敛速度和较好的近端干扰鲁棒性。同时,我们将提出的算法扩展到分块频域自适应滤波框架中,能够满足实际应用中的低延时的需求。  (2)提出一种基于Huber M-估计子和分界点更新的仿射投影自适应滤波算法。与归一化最小均方误差算法相比,仿射投影算法具有更快的收敛速度,但是其稳态误差更大。新算法通过对经典仿射投影算法的目标函数进行修饰,对目标函数施加Huber M-估计子,并且对修饰后目标函数的分界点进行自适应更新,在保持算法较快收敛性能的前提下,有效较低了算法的稳态误差。  (3)提出一种改进的基于卡尔曼滤波的回声消除算法。卡尔曼滤波在解决系统辨识问题时具有很好的性能,因而近年来被引入到声学回声消除问题中。对卡尔曼滤波算法来说,其系统不确定量的控制对算法性能有着至关重要的影响,本文提出一种基于残余回声估计的系统不确定量计算方法,有效改善了传统卡尔曼滤波在回声消除应用中对近端干扰不够鲁棒的问题。  2.对多通道噪声抑制算法进行研究,提出一种多通道维纳滤波参数优化方法。参数化的多通道维纳滤波算法是多通道噪声抑制的一个研究热点,本文提出一种目标降噪量导向的参数优化方法,能够自适应地平衡降噪性能和语音保真效果。同时,我们指出部分传统算法均可以由本文提出的算法导出,因而具有重要的理论意义和实践价值。  3.针对方向性干扰源抑制问题,对波束形成算法进行研究。  (1)提出一种基于目标参考比和贝叶斯框架的可变对角加载波束形成算法。基于对角加载的波束形成算法计算量小,对较小的导向矢量误差不敏感,但是对较大的导向矢量误差不够鲁棒。本文提出基于目标参考比的可变对角加载波束形成算法,改善了固定对角加载波束形成算法的鲁棒性,并且新算法引入了贝叶斯框架,提升了算法对较大的导向矢量误差的鲁棒性。  (2)提出一种基于两阶段导向矢量估计的波束形成算法。现有的基于导向矢量估计的波束形成算法通常需要凸优化工具箱求解,计算量较大。新算法将导向矢量估计分为两个阶段,第一阶段假设目标导向矢量可以表示为某正交子空间特征向量的线性组合,通过最大化估计的导向矢量和目标导向矢量的相关性求得估计的导向矢量在该正交子空间下的坐标。第二阶段结合传统的鲁棒Capon波束形成算法,得到最终的导向矢量估计。新算法跟传统算法相比计算量相当,但是无需凸优化工具箱求解,更为方便。  (3)提出一种基于空间预判决的双传声器波束形成及后滤波算法。实际传声器阵列增强应用中,受硬件和计算资源所限,多采用双传声器解决方案。新算法通过最大化输出信噪比求取滤波器系数,并采用基于相位差的空间预判决指导目标和干扰协方差矩阵的估计,结合后滤波方法,能够获得较好的方向性干扰抑制效果。
其他文献
目的 探讨小核糖核蛋白颗粒蛋白SmD3 (small ribonucleoprotein particle protein SmD3,SmD3)表达改变对果蝇Schneider 2(S2)细胞中剪接体成分U2A的影响.方法 通过转染构建敲
猪的生长发育和肉质性状是养猪生产中两个重要的经济性状,关系到养猪生产的经济效益。畜禽的生长发育是一个复杂的生理生化过程,受多因素的影响,其中遗传因素在影响畜禽生长发育
目的 分析组蛋白去甲基化酶LSD1对直肠癌CACO-2细胞系侵袭能力的影响.方法 构建LSD1敲降的直肠癌CACO-2稳定细胞系;采用克隆成球实验与流式细胞术检测各组间干细胞差异;采用T
移动通信网络的发展和数据应用业务的迅速增长,对移动网络的吞吐量及频谱利用率提出了更高的要求,这使得以正交频分多址(Orthogonal Frequency Division Multiple Access, OF
地层电阻率原始数据可由多种方式获得,其中的阵列侧向测井技术由双侧向测井技术发展而来。作为聚焦测井技术中的一种,阵列侧向测井技术能显著降低冲洗带、上下围岩等因素对视
目的:构建人3型腺病毒载体嵌入登革热病毒抗原表位的重组腺病毒,为人3型腺病毒衣壳嵌合载体的应用及登革热病毒疫苗的研究奠定基础。  方法:人3型腺病毒骨架质粒pBRAd△E3GF
生境条件与干扰程度构成的生境异质性,是植物生活史型形成的主要外因;而植物体内的能量在生活史不同性状间分配的权衡关系,形成了生活史型的多样性。抗坏血酸、谷胱甘肽作为
图像宽基线立体匹配就是在由相同或者不同摄像机在不同投影系数,不同视角下采集图像中对三维空间中同一点进行对应。图像间的宽基线立体匹配是计算机视觉,图像模式识别领域的
当前无线通信正朝着高速率高带宽方向发展,以3GPP为代表的国际组织正积极推动4G的标准化,其中协作多点传输技术(CoMP)以其提高小区边缘吞吐量、扩大小区覆盖范围的优势被纳入
摘要:口算训练要联系生活,激发学生的兴趣;口算训练要有计划、有步骤、常抓不懈;口算训练要加强直观操作,让学生理解算理; 口算训练要运用迁移,掌握方法;口算训练要变化练习形式;严格训练,养成良好的学习习惯 ;七、口算训练要通过竞赛激励,建立科学的评价体系。  关键词:兴趣;算理;方法;习惯;常抓不懈  引题:为什么要提出这个问题?  本人是一名从教17年的农村教师,有十几年的数学教学经验。从自己的教