说话人识别算法研究及其实现

来源 :五邑大学 | 被引量 : 0次 | 上传用户:a275505
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别属于生物特征识别技术的一种,是一项根据语音信号中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,说话人识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。 说话人识别系统主要包括两部分,即特征检测和模式匹配。特征检测的任务是选取唯一表现说话人身份的有效且稳定可靠的特征,模式匹配的任务是对训练和识别时的特征模式做相似性匹配。说话人识别可以分为说话人辨识和说话多人确认两大类,本文的研究内容是任意文本的说话人确认系统,主要做了以下工作: 1. 介绍了人类语音产生的原理及其数字模型,为课题的研究奠定基础。 2. 研究了常见的几种说话人特征的性质和提取方法,这些特征包括基音周期、FFT倒谱、LPC倒谱、MEL倒谱等等。 3. 对于传统VQ算法和基于遗传算法的VQ算法的研究。 4. 讨论了传统GMM说话人模型的建模方法,并详细研究了用于GMM模型建模的EM算法,建立了基于传统EM算法GMM模型。 5. 研究了用于提高任一给定算法的性能的通用算法,AdaBoost算法。讨论了将AdaBoost算法与GMM算法结合,用于建立AdaBoost-GMM模型。 6. 最后根据LBG-VQ算法、基于遗传算法的VQ算法、GMM算法、AdaBoost GMM算法弱分类器、AdaBoost-GMM算法强分类器五种模型得出实验结果,并对这五种模型得出的实验结果进行比较。
其他文献
目的:分析产科应用母婴护理模式的可行性。方法选择我院自2014年1月-2015年12月收治的261例产妇,将其随机分为2组,对照组131例,观察组130例。对照组给予一般护理,观察组在对照组基
SIP(Session Initiation Protocol)是IETF提出的新一代多媒体通信框架信令协议,业务逻辑实现功能灵活、简便,支持有线、无线网络的无缝接入,成为NGN的核心协议。SIP在移动网络中
目的:探讨乳腺癌改良根治术加乳房重建术的护理方法。方法:对我院进行的8例乳腺癌改良根治术加乳房重建术的护理患者进行手术前的准备和心理护理。并且,在手术后对其进行常规护
目的:分析总结血管外科病人的疼痛护理干预措施。方法:回顾性分析我院血管外科收治的66例疼痛护理的临床资料,总结有效的疼痛护理措施。结果:所有患者经过科学、有效的护理干预后
本文针对临床手术切口感染这一情况作了影响因素分析,在此基础上提出了降低手术切口感染的护理对策,为临床上降低手术切就感染率,提高患者术后的生活质量,保证预后提供可靠的理论
在我国糖尿病的患病率随着人民生活水平的提高,饮食结构和生活方式的变化而快速增加,糖尿病的患病率、致残率和病死率以及对人体健康的危害程度据慢性非传染性疾病的第三位[1]
研究分析膝关节置换术后的患者进行康复训练护理。方法:选择我院膝关节置换术后的患者60例,手术后实施康复训练计划。结果:采用我国特种外科医院(HSS)膝关节评分标准,术后一年复查
目的:探讨ICU应用持续性人文关怀理念的护理的临床疗效。方法:选择我院94例患者,随机分为观察组和对照组,各47例。对照组给予常规护理,观察组在对照组的基础上给予持续性人文关怀
目的:探讨护理干预对脑梗死运动性失语患者语言康复的影响。方法:选取我科在2015年2月-2016年1月期间收治的66例脑梗死运动性失语患者作为本次的研究对象,并将其进行随机分为对
目的:探讨心理护理对急性闭角型青光临床护理中的应用效果。方法选取我院自2013年6月~2015年8月间收治的100例急性闭角型青光眼患者作为研究对象,随机将其分为将所有患者分为观