论文部分内容阅读
目前的说话人识别系统对纯净语音已经可以达到很高的识别精度,但实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降,因而抗噪声的研究是说话人识别系统实用的关键。本文针对说话人识别技术的两大关键的问题进行了研究,主要的研究内容包括:1.本文主要分析了MFCC的提取原理和小波分析在语音信号处理中的应用,并且提出了一种在子带能量的计算和子带能量的分离上都是基于小波分析的新特征参数FPBW的特征提取方法。实验证明了提出的新特征参数FPBW比传统的特征参数具有很好的识别效果,并且具有很好的鲁棒性。2.针对受白噪声污染的语音信号,首先将小波分析应用于说话人识别的前端处理,利用其多分辨分析特性将语音信号和噪声分离,实现语音增强;然后将处理后的语音输入到说话人识别系统。实验结果表明,这种方法能有效地去除噪声,提高系统的噪声识别率。3.利用小波降噪技术进行说话人识别的前端处理,再进行新特征参数FPBW的提取,将这两种方法结合在一起得到了一种新的抗噪声方法,实验证明这种方法具有很好的抗噪声性能。4.高斯混合模型(GMM)是说话人识别中广泛使用的识别方法,针对本文中采用的小波变换需要的运算量大,而高斯混合模型所需要的训练时间长,因此对高斯混合模型进行改进得到了一种新的高斯混合模型正交高斯混合模型(OGMM),采用正交高斯混合模型,将正交变换应用到EM算法之前,提高了系统的运算速度。