基于高斯混合模型的与文本无关闭集说话人辨认研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:jiuki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于生物特征的身份识别技术是当前国际上的重点研究内容,自动说话人识别通过语音识别说话人的身份,由于其信息来源获取的简单性,其在系统安全认证、司法鉴定、金融服务以及电子侦听等领域有着广泛的应用价值。说话人识别包括说话人辨认和说话人确认2个方面,本文专注于在干净语音、闭集、与文本无关条件下,对普通话的注册用户做说话人辨认研究。 整个说话人辨认系统主要由特征提取、模型生成和判据生成3种功能模块组成,目前,研究者们公认的最具代表性的说话人辨认系统为:采用美尔倒谱系数(MFCC)作为特征矢量;采用高斯混合模型(GMM)为注册者参数模型;采用贝叶斯判据为判据生成方式。研究的重点是对说话人辨认中最常用的注册者参数模型GMM的改进。 本文的主要研究内容如下:一、提出了一种GMM的改进模型:时间-空间分布模型(TSDM)。相对于只包含特征矢量空间分布信息的GMM模型,TSDM能在空间分布信息的基础上引入一定程度特征矢量间在时间上的统计联系,将时间信息和空间信息融合到一起,从而提高了说话人辨认系统的识别率。同时,仿效GMM的判据生成过程,提出了一套TSDM相应的判据生成方法。 二、提出了一种“改进的分维GMM”(MIDGMM)训练的方法。通过去相关和根据离散直方图中峰的个数决定“分维GMM”训练时混合分量的个数,该方法能在大幅提高训练速度和缓解“维数灾难”的基础上相对于传统GMM保持甚至提高识别性能。 三、为了“改进的分维GMM”算法中去相关的需要,提出了一种基于Schmidit正交化的去相关方法。相对于传统的去相关方法PCA,Schmidit正交化能以一种运算量较小的方法实现相同的去相关效果。
其他文献
目的:探讨医护一体化管理干预在带T管出院患者中的应用与效果。方法:将80例术后带T管出院患者按出院先后随机分为观察组和对照组各40例,对照组实施传统服务模式(出院健康教育+出
目的:探讨对桡骨远端骨折的患者实施手术治疗与保守治疗的方法和临床效果。方法:选取桡骨远端骨折患者60例,随机均分为两组,对对照组30例患者进行保守治疗,对观察组30例患者进行手
在能源日益紧缺、环境问题日益凸显的今天,由于具有亮度高、能耗低、寿命长、性能稳定等诸多优点,白光LED越来越广泛地应用于生活与商业照明。室内可见光通信(Visible Light
我们中国是文明礼仪之邦,作为一个中国人礼仪是必备的,作为一名学生,身为国家未来发展的力量,必备基本礼仪是很重要的,而当前在中职学校,学生出现了很多不文明现象,所以为了提高学校
随着因特网的迅速普及和数字视频媒体交流的日益频繁,人们对于数字视频媒体的版权保护等问题也逐渐重视起来。在视频水印技术领域,尤其是对于有意义的多比特视频水印,其检测器的
目的:探讨颌骨囊肿的治疗方法。方法:回顾性分析75例不同大小的颌骨囊肿的2种不同手术方案。结果:75例颌骨囊肿术后均未复发,10例接受开窗术减压治疗的大型囊肿术后愈合良好。结
期刊
目的:探讨慢性咽炎的疗法及疗效;方法:回顾分析我院2012年1月-2015年12月我院门诊及住院慢性咽炎的患者168例;其中76例要求口药物治疗,给与患者口服阿莫西林和西瓜霜润喉片对症治
目的:探讨缬沙坦氢氯噻嗪片治疗老年原发性高血压的临床疗效及对肾功能保护作用。方法:选择50例老年原发性高血压患者口服缬沙坦氢氯噻嗪片(80mg/12.5mg)每日1片,共8周。观察治疗
目的:探讨ICU住院病人信息栏的设计及应用。方法:介绍了ICU住院病人信息栏的制作材料及使用方法,风险评估,根据病人信息栏的设计构造,并结合临床护理实际工作情况有效应用。结果:不
双向DC/DC变换器(Bi-directional DC-DC Converter,缩写为BDC)是一种新型的能量变换技术,它可以实现能量的双向流动。 本文首先介绍了微小卫星供电系统中的BDC设计方案,并