论文部分内容阅读
在传统语种识别中,特征研究的目标在于提取各个语种间的语言鉴别性信息。但在安全领域应用中,常常只对某一特定语种感兴趣,这就要求特征能够最大限度的体现目标语种与其他语种间的差异。为了解决这个问题,本文对在语种识别任务中取得优秀性能的对数域音素后验概率特征进行优化,来提高目标语种检出任务的性能。我们应用F 比方法来分析特征向量每一维对目标语种检出的贡献大小。在本文方法中,首先利用音素识别器来估计帧级的音素后验概率;然后将其变换到对数域;接着根据特征向量每一维F 比的值,通过加权的方式来优化特征;最后,利用主成分分析方法来去除特征相关性,并降低其维数。在美国国家标准技术署2007 年语种识别测试集上的实验显示,在高斯混合模型-支持向量机系统上,相比于应用原特征的结果,本文优化后的特征在等错率指标上取得了显著的提升。