论文部分内容阅读
随着科技的进步和先进生活理念的日益深入,智慧家庭(Smart Home-SH)正逐步成为现实。尤其是近年来互联网、人工智能、生物识别等技术的突飞猛进,对SH的发展提供了更多方面的参考,可以广泛的应用于日常生活中,让科技的进步造福人类。然而,现在的生物识别技术尤其是声纹识别,除了在重要的安全部门,即便是在国外,很少见于SH的领域。本文针对声纹识别在智慧家庭领域的应用及其相关问题进行了详细的分析和深入的研究。本文的贡献点可以概括如下:1.研究了声纹识别的特征提取问题。从声纹识别的角度对声音的性质进行了深入的分析,然后根据这些性质,结合SH的应用场景,分别实现了两种特征提取算法,即线性预测系数(LPC-Linear Prediction Coefficiebt)法和Mel倒频谱系数(MFCC-Mel-Frequency Cepstral Coefficiebt)法。通过实验发现LPC算法时间性能明显优于MFCC算法,然而MFCC算法处理得到的声纹特征信息量则优于LPC算法。2.研究了声纹识别的特征匹配问题。对声纹特征的匹配进行了深入的分析,根据不同声纹特征的侧重点,结合SH的应用场景,实现了声纹匹配算法的详细研究,实现了最为常见矢量量化模型(VQ-Vector Quantity),同时根据三种距离测度算法和两种聚类算法对VQ算法进行了测试,对欧氏距离、曼哈顿距离和切比雪夫距离这三种距离测度算法,结合LBG聚类算法和K-means算法两种聚类算法,得到六种特征匹配的组合模型。结合识别模型的性能测试,最终取得适应于小规模说话人声纹识别的特征匹配的参数配置。3.声纹识别语音库的设计和语音采集,结合实验需求,将语音库原型按照训练集和测试集拆分开,同时按照性别、语音长短等设计出多种数据集格式。为有针对性的进行声纹识别研究打好基础,同时也为数据集设计方面提供了宝贵的经验。