论文部分内容阅读
随着信息技术和通信技术的迅速发展,个人身份鉴定变得越来越重要。说话人识别作为一种生物认证技术,因其具有使用方便、安全性高和不会被遗失等优点,有着广阔的应用前景。说话人识别是从说话人的一段语音中提取出表征说话人的个性特征的参数,通过对这些参数的分析,从而达到对说话人进行辨认或者确认的目的。Hilbert-Huang变换(HHT)是黄锷于1998年提出来的一种新的信号处理方法,其核心部分是经验模式分解(EMD)。我们将HHT应用于说话人识别,获得了一些初步结果。本论文在对说话人识别进行综述和对HHT详细介绍的基础上,主要作了以下三个工作:(1)提出用线性预测的方法来解决EMD中的端点效应。用线性预测的方法对数据进行端点延拓得到新的极值点,从而减少在拟合数据包络线时两端点处出现的误差。通过与其他方法对比,初步阐明了本文提出的方法在处理EMD的端点效应上的有效性。(2)基于EMD分解,提出用六个方面的参数来表征说话人个性特征。对语音信号进行EMD分解后,分别采用不同的方法,确定了EIF、ED、IMF-MFCC、IMFMFCCW1、IMFMFCCW2和CEI等特征参数,通过计算D比值来对它们进行有效性测试,从计算得到的D比值看,知在这六个特征参数中,特征CEI是最有效的,其它按降序依次为IMF-MFCC、IMFMFCCW2、IMFMFCCW1、ED、EIF。(3)利用这些特征参数,通过矢量量化的方法进行说话人辨认实验。利用提取出的六个特征参数EIF、ED、IMF-MFCC、IMFMFCCW1、IMFMFCCW2和CEI,采用矢量量化的方法进行说话人辨认实验。实验结果表明,在这六个参数中,以CEI作为说话人的个性特征最有效的,其它按降序依次为IMF-MFCC、IMFMFCCW2、IMFMFCCW1,而EIF、ED则不适宜单独作为说话人识别的特征参数。通过与传统的MFCC特征进行比较发现,以CEI进行实验时,当码本长度增加到40后,识别效果己与MFCC差不多,且最高识别率能达到98%以上,但是,特征参数CEI的维数要小于MFCC,在识别过程中的效率要高一些,说明以CEI作为说话人的个性特征是有实际意义的。