论文部分内容阅读
实际生活中的语音不可避免的要受到噪声的干扰,强背景噪声会严重影响语音信号的质量。因此,在语音通信中必须采取措施抑制背景噪声、提高语音质量。语音增强是消除语音通信中噪声干扰的有效方法,其目的是从背景噪声中提取、增强有用语音信号,抑制、降低噪声干扰,尽可能从带噪语音信号中提取纯净的原始语音。语音增强已发展成为语音信号处理的一个重要分支。
目前,平稳环境下的语音增强已经取得了较好的效果,非平稳环境下的语音增强成为今后研究的热点。本文主要研究了时变噪声电平环境下的语音增强,包括非平稳环境下的端点检测、变噪声电平环境下的噪声估计和基于人耳掩蔽特性的语音增强算法。
非平稳环境下噪声的短时能量是时变的,所以不能用短时能量进行端点检测。但是,无论噪声电平多大,其自相关函数除代表能量的第一个值外,其余值都很小。因此,可以用自相关函数代替短时能量去确定语音的开始点和结束点。
噪声估计是变噪声电平环境下语音增强的关键。针对传统搜索频谱最小值方法延迟较大的缺点,本文提出了最小频带能量算法,加快语音帧内大部分噪声的更新速度。实验结果表明,该算法对电平随时间变化的噪声取得了较好的增强效果。
在语音增强方面,本文首先比较了几种基于短时谱的单通道增强方法,然后将人耳的掩蔽特性与谱减法相结合。提出了一种基于掩蔽阈值动态调整谱减系数的算法。实验证明该算法在噪声消除、音乐噪声抑制和减小语音失真三者之间取得了较好的平衡。