论文部分内容阅读
移动通信网络中的语音增强技术是目前语音信号处理领域的研究热点之一。本文针对3G通信网络中的3GPP(The3rd Generation Partnership Project)AMR-WB(Wideband Coding of Speech at around16kbit/s using Adaptive Multi-RateWideband)宽带语音编码标准,研究并实现了两种压缩域语音增强算法,以明显抑制背景噪声,同时提高语音客观质量。 本文所构建的压缩域语音增强算法框架主要包含三个模块。首先,利用对数线性预测(Linear Prediction,LP)谱能量特征将背景噪声分为有色噪声和白噪声两大类;然后计算增益调整因子,并联合调整含噪语音的自适应码书增益和固定码书增益:最后,在白噪声背景下选择适当的准则对线性预测编码(LinearPredictive Coding,LPC)参数进行调整,而在有色噪声背景下则利用梳状滤波器进一步增强谐波结构。 在基于码书增益联合调整的压缩域语音增强算法中,采用固定码书增益最小值搜索方法估计噪声强度,以计算增益调整因子,同时利用线性外推方法调整含噪语音的LP参数。 为有效利用纯净语音导抗谱频率(Immittance Spectral Frequency,ISF)参数的先验知识,本文利用纯净和含噪语音的ISF参数,以及对应的增益调整因子构成特征矢量,使用高斯混合模型拟合含噪和纯净语音特征参数的联合概率密度,并在最小均方误差准则下对纯净语音的特征参数进行最优贝叶斯估计。 同时,为了兼容AMR-WB语音编码器中的非连续性传输(DiscontinuousTransmission,DTX)情况,本文所提算法在保持噪声帧谱包络参数不变的前提下,对对数帧能量进行衰减以抑制噪声成分。且当帧擦除情况出现时,算法不对输入码流进行调整,同时利用解码端的帧擦除掩蔽(Frame Erasure Concealment,FEC)操作恢复各码流参数,按照正常帧处理方法进行增强并更新相关历史。 采用国际电信联盟电信标准部(International Telecommunication Union,Telecommunication Standardization Sector,ITU-T)G.160标准对本文所提算法进行性能测试。测试结果表明,与参考算法相比,本文所提的两种压缩域增强算法均可以在保证较高信噪比提高的同时,达到较大的噪声衰减量,并且有效提高增强语音的客观质量。