基于VP树和GMM的说话人识别研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lchf1129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号传递着许多方面的信息,比如说话的内容、说话人使用的语言、说话人性别和其身份信息等。说话人识别就是提取语音信号中包含的说话人身份信息并以此辨别其身份的技术,是生物识别技术的一种。经过数十年的发展,说话人识别技术已经在网络接入控制、电话银行交易认证、司法安全等领域获得了广泛的应用。目前常用的说话人识别方法主要可以分成两大类:一种是基于模版匹配的方法,另一种是基于概率统计的方法。模版匹配方法提取测试语音的特征向量,并计算与训练语音中的特征向量的相似度,特点是模型简单、计算量小,但是识别精度不高,并且训练数据对识别性能的影响比较大。概率统计方法用特定的概率密度函数来描述说话人的特征,识别过程计算测试语音中提取的特征向量与概率密度函数的对数似然比,优点是模型精确、识别率高,但是模型复杂、训练和识别过程计算量大。随着说话入识别系统的注册人数增加,识别过程所用时间大幅增长,导致识别速度显著降低,难以满足系统的实时性要求。针对常用模型的上述不足,本文提出了一种基于VQ-VP树和GMM-UBM的双层说话人识别模型,将识别过程分成两步进行。首先快速搜索出与待识别说话人声纹特征最相近的K个目标说话人,然后利用GMM-UBM精确计算测试特征向量与这K个目标说话人的似然度,做出判决。快速识别模型采用VQ-VP树方式,即利用矢量量化的LBG算法建立说话人码书,并采用VP树对所有码书中的码字进行索引,搜索过程为对数时间复杂度,因此可以实现快速识别。精确识别模型采用GMM-UBM,保证识别精度,并采用快速得分算法,进一步减小计算量。双层识别模型结合了模版匹配方法的快速性和概率统计方法的准确性,在识别性能损失有限的情况下提高了系统的识别速度。
其他文献
当今社会,随着人们工作和生活压力的增大,心脏疾病的发病率和致死率居高不下,给人们的健康乃至生命安全造成了极大威胁。GPRS远程心电监护系统可对受检者进行实时的心电信号采集
期刊
期刊
期刊
在农业机械化、自动化过程中,果实采摘机器人逐渐成为研究热点。目前,利用GPS定位技术进行农业机器人自主导航研究变得越来越广泛、成熟。本文以博创“旅行家IV”移动机器人作
期刊
作为一种集成多种高精尖科技的大型复杂系统,卫星发挥的作用已经体现在各种领域中,并占有无可替代的位置。然而,卫星常年暴露在恶劣的宇宙环境中,会受到太阳活动、宇宙射线,太空垃圾等外界因素的干扰,同时其在工作过程中由于一些内部自身因素,都会导致故障的发生。卫星在长期监测管理的过程中,会产生大量遥测数据,从中可挖掘出各种有用信息,然后有效利用关键参数的潜在变化规律来进行未来趋势预测,对于卫星正常工作具有重
期刊
期刊