论文部分内容阅读
随着电话和手机的普及,电话语音在人们的同常生活中占有越来越重要的地位。使用电话语音来进行话者身份的鉴别具有快捷方便等多种优点,越来越受到人们的重视,其技术拥有广泛的应用前景和重要的实用价值。
支持向量机是一种区分性模型,具有良好的区分性和泛化性,是目前模式识别领域的研究热点。高斯混合模型是概率统计模型,其通过概率统计能够较好的描述话者的特征分布,但其区分性有待进一步提高。本文将支持向量机用于文本无关的话者确认作为研究方向,对基于SVM并使用GMM进行特征映射的文本无关话者确认方法进行了深入的研究。主要研究内容如下:
1.深入分析了GMM-UBM的结构特点,并通过实验分析了混合度的选取对于GMM-UBM确认系统的性能影响以及快速算法Top C中C的取值问题等问题。
2.深入讨论了基于支持向量机的话者确认中的各个环节,包括建模策略,背景话者的选取,SVM的输出评分,以及核函数的选取等,并通过实验进行了分析。
3.详细分析了文本无关话者确认中,SVM直接用作话者模型时所面临的大样本,语义信息干扰,特征空间混叠等困难,给出了一种利用GMM进行聚类变换的方法。这种方法利用GMM做前级进行特征变换,对MFCC数据集进行了聚类压缩,将其转化为统计参数,进一步突出话者个性信息,减少了特征空间的混叠现象,有效的解决了SVM直接用作为话者模型时所面临的困难。
4.提出了一种基于GMM全统计参数并结合SVM核函数的特征参数。这种参数充分利用了GMM的均值,方差和权重三种统计参数,仅使用线性核函数就建立了具有良好鲁棒性和区分性的SVM话者模型。文中通过实验对其性能进行了分析。