基于改进高斯混合模型的说话人识别方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:huangli_java
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种利用语音信号来验证说话人身份的技术,与人脸识别,指纹识别,同属于生物特征识别的范畴。说话人识别可广泛的应用于金融,通信,安全等领域。   高斯混合模型是目前主流的说话人识别技术,目前高斯混合模型的参数估计方法主要是基于极大似然估计的EM算法。EM算法简单稳定,但对初始值较敏感,而且EM算法中无法实现自适应的参数选择,即采用EM算法的高斯混合模型的高斯密度函数的个数是给定的,必须依赖于先验专业知识进行选择,带有一定的主观性。   对于第一个问题,本文将蒙特卡罗过程中的吉布斯抽样算法引入高斯混合模型中的参数估计当中,避免了EM算法中的初始值敏感问题,同时使参数的收敛更快,从而提高了说话人识别系统的性能。   对于第二个问题,本文提出了一种无限高斯混合模型。理论上高斯混合模型是由无限个高斯密度函数组成的,高斯密度函数是否能够显现取决于是否存在由其产生的观测值。推导过程本身使用狄力克雷过程构造无限混合模型,通过蒙特卡罗过程中吉布斯抽样的方法来估计模型参数。实验证明,无限高斯混合模型能够有效的提高说话人识别系统的辨识率。   噪声和干扰一直是影响识别率提高的原因,大多数研究工作集中在模型的前端处理,在说话人识别后端处理方面研究不多。本文提出了一种新的非线性变换方法——归一化变换,该方法对帧似然概率进行变换从而得到帧得分,将前N帧得分进行平均,作为当前帧得分的权值。实验表明,归一化指数变换能够提高识别率,也就是说对说话人识别系统的后端进行处理也能够提高系统性能。
其他文献
“我志愿加入中国共产党,拥护党的纲领,遵守党的章程,履行党员义务……”5月24日,四川汶川大地震已经过去12天,仍有余震不断,但在北京电视台赴地震灾区报道队驻地,雄浑而坚定
2008年6月10日,中国共产主义青年团第十六次全国代表大会在北京隆重召开,党和国家领导人胡锦涛、吴邦国、温家宝、贾庆林、李长春、习近平、李克强、贺国强、周永康等到会祝
期刊
集合卡尔曼滤波(EnKF)在传统卡尔曼滤波(KF)中演变而来,对反演水文地质参数来讲具有十分重要的应用价值.集合卡尔曼滤波的应用通常适用于预报以及分析等作用,在水文地质学中
期刊
目的研究Sulforaphane(SFN)对细胞凋亡的抑制作用及其在脓毒症中对细胞的保护作用。方法将HeLa细胞分为4组:对照组、热灭活大肠杆菌(Escherichia coli,E.coli)处理组、SFN处理组(SFN组)和热灭活E.coli +SFN组。酶联免疫反应检测炎症因子白细胞介素(interleukin,IL)-1β和肿瘤坏死因子(tumor necrosis factor,TNF)
期刊
期刊
太白金矿的矿化共经历了4个成矿阶段,其中黄铁矿-含铁白云石阶段是最重要的金矿化阶段.黄铁矿为主要载金矿物.黄铁矿中铂的含量与Au+Ag含量呈负相关,金矿物主要以微米级的自然金产