论文部分内容阅读
移动通信和语音识别系统等语音信号处理系统不可避免的受到背景噪声的影响。近年来,以消除背景噪声、改善语音质量的语音增强技术一直是语音信号处理领域的热点问题。本文在传统的统计模型方法框架原理的基础上利用金融等领域广泛应用的广义自回归条件异方差(GARCH,Generalized AutoregressiveConditional Heteroskedasticity)模型原理,在先验信噪比估计、噪声估计等方面做了深入研究,提出了一套基于GARCH模型的语音增强方案。本文所提算法可以在有效的消除噪声的同时,保证增强后的语音质量。 本文研究工作主要体现在以下几个方面: 首先,本文简要回顾了基于统计模型的增强方法框架原理并研究了现有经典的先验信噪比估计方法。通过研究广义自回归条件异方差模型在时频域对语音信号建模的理论方法,提出了一种基于β阶GARCH模型的先验信噪比估计算法,该算法考虑到语音信号在不同频带的特点,利用β阶GARCH模型对语音信号建模,并在临界带中利用不同子带的信噪比等信息更新模型阶β的值。针对本文提出的β阶GARCH模型参数选取问题,引入了一种自相关方法并通过Levinson-Durbin算法实时更新模型的参数。进一步,考虑到语音存在性的问题,为了更好的消除噪声,本文提出了一种带有软VAD(话音激活检测)的β阶GARCH模型先验信噪比估计算法,引入了计算子带谱熵的方法,并利用谱熵信息控制软VAD函数。该算法应用到语音增强中能够获得较好的语音增强效果且性能优于对比方法。 其次,本文分析了经典的噪声估计算法。在深入研究最小控制递归平均(MCRA,Minima-Controlled Recursive Averaging)算法的基础上,为了提高噪声估计方法的性能,利用GARCH模型在时频域对噪声信号建模,提出了基于最小控制GARCH(MC-GARCH,Minima-Controlled GARCH)模型的噪声估计算法,并利用均方误差测试方法对其进行了测试。测试结果显示,本文提出的MC-GARCH噪声估计算法能够较为为准确的估计噪声信号的功率谱,且性能更优。 最后利用本文提出的基于GARCH模型的先验信噪比估计算法和噪声估计算法,实现一套完整的基于GARCH模型的语音增强算法。并采用分段信噪比提升,谱失真,PESQ(Perceptual Evaluation of Speech Quality)等测试标准对本文所提各算法的语音增强性能进行测试,测试结果表明,本文所提算法能够获得更好的噪声消除效果、提高增强语音的质量。