论文部分内容阅读
说话人识别系统如果测试语音的采集环境发生变化,比如有背景噪声的干扰,使用了不同的麦克风等,则训练模型和测试语音之间会失配,造成系统的识别性能急剧下降。 本文正是针对这个问题进行探索性研究,将麦克风阵列语音增强技术引入到噪声环境下的说话人识别当中来。主要工作为: 1.探讨了稳健的说话人识别的研究现状和研究意义。 2.讨论了与文本无关的说话人识别系统,详细讨论了基于矢量量化(VQ)和高斯混合模型(GMM)的识别算法,并用MATLAB实现了基于这两种方法的说话人识别系统。 3.研究了麦克风阵列语音增强技术,详细研究了其中的延迟-求和波束形成、自适应波束形成、后置维纳滤波的波束形成技术,并分析了各方法的消噪性能。同时还详细研究了基于信号子空间的麦克风阵语音增强算法。 4.探讨了改进的稳健性Mel频率倒谱系数(MFCC),并应用于本文的说话人识别系统中。 5.将麦克风阵列语音增强技术融合特征补偿技术用于抗噪声的说话人识别当中。实验结果表明该方法能显著提高噪声环境下的说话人识别率。