论文部分内容阅读
语音增强的目的是改进语音质量,在消除背景噪声的同时提高语音可懂度。目前一些对非平稳噪声干扰下的语音信号进行增强的方法,可以降低背景噪声,但是有时会引入不舒服的音乐噪声,而且这些方法不能很好的提高语音的可懂度,甚至使其略有下降。基于短时幅度谱估计(STSA,Short-timeSpectralAmplitude)的方法作为一种单通道语音增强方法,以其简单有效深受欢迎。
语音增强系统中一个重要组成部分即为噪声功率谱估计。传统的估计方法是在无语音段估计出噪声值,而在有语音段用此值近似代替。为了区分有语音段和无语音段,就需要对带噪语音信号进行语音活动性检测(VAD,voiceactivitydetect)。然而,语音活动性检测的可靠性在弱语音信号以及低输入信噪比的条件下急剧恶化,而且在非平稳噪声环境下严重制约了对背景噪声的追踪性能。
本文通过一个非线性函数,根据带噪语音信号的信噪比对非平稳背景噪声信号进行估计,应用最小均方误差估计方法(MMSE,minimummean-squareerror),利用估计出的噪声功率谱得到相应的谱增益,进而估计出纯净语音信号的短时幅度谱。方法中对谱增益的修正,可以进一步抑制低信噪比时的残留噪声以及降低对带噪语音信号的过抵消。本文用MATLAB实现了整个算法的仿真,并与传统的谱相减法、最小均方误差短时幅度谱估计(MMSE-STSA)方法的增强结果相比较。仿真结果表明,该算法对非平稳噪声的追踪性较好,在抑制背景噪声,减少音乐噪声的同时,提高了语音的可懂度,其计算复杂度也有很大优势,便于该算法在实际中的使用。