说话人身份识别系统的设计及DSP实现

来源 :苏州大学 | 被引量 : 0次 | 上传用户:dddbj126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别属于生物识别的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数来自动识别说话人身份的技术。在生物识别技术领域中,说话人识别技术以其独特的方便性、经济性和准确性等优势受到人们的关注。近年来随着DSP技术的迅猛发展及其性能的不断改善,用DSP来做语音实时处理也越来越受到人们的重视。基于DSP的说话人识别系统具有精度高、速度快、体积小、操作简单、成本低等特点。可广泛的用于司法、公安、机场、办公室等场所,具有非常广阔的应用前景。本文概述了说话人识别技术的概况及特征提取、模式识别等说话人识别的主要技术理论。详细地分析基音频率、线性预测系数、美尔倒谱系数等特征提取的理论和方法以及动态时间规整、矢量量化、隐马可夫模型、高斯混合模型等模式匹配算法的原理及过程。在此基础上,论文针对实际应用进行DSP嵌入式说话人识别系统的设计,并研究如何提高系统的可靠性、识别率、减少识别时间并实现系统的自举运行。系统在TMS320C6713 DSK上实现,采用美尔倒谱系数作为特征参数,以高斯混合模型作为识别模型。为了实现自举运行,模型参数存储在FLASHROM存储器中,以保证参数在掉电情况下不会丢失。系统充分的体现了人性化特点,设置了训练和识别的选择功能,并可进行说话人删除、补充、替换和更新工作;系统运行过程中,由DSP实验板自带的LED灯组合来显示系统的运行状态及最终的运行结果。考虑到识别时间、识别准确率,系统稳定性的要求并结合TMS320C6713 DSK开发板的性能和特点,系统的识别范围选定为10个人。经过测试,识别的速度可达3秒之内,准确率达98%以上。与其他系统相比,本系统在实现方法上加以一定的改进,保证了识别的准确率和系统的稳定性;减少了识别时间;实现了系统的自举运行;同时充分的体现出了系统可操作性,具有更大的实用价值。
其他文献
国际文凭组织(the International Baccallaureate Organization,简称IBO)创立于1968年,是在联合国科教文卫组织注册的非赢利国际教育基金会,是世界公认的国际教育领跑者.它的
在新农村建设过程中,广大农民致富心情迫切,他们渴望学习科学知识和技术,但是环境的闭塞和信息的不畅通,又使农民对现代科技知识缺乏学习渠道。湖南省石门县罗坪乡党委在下村
入选苏教版高中语文教材时,保留了以往教材删去的一个集中议论的段落.其原文为:呜呼!予之生也幸,而幸生也何为?所求乎为臣,主辱,臣死有余谬;所求乎为子,以父母之遗体行殆,而
红外成像具有较强的抗干扰能力,利用红外成像传感器实现目标实时跟踪己经成为精确制导武器的核心技术。机场作为重要的战略目标,不但在军事上有着极为重要的意义,而且是国民经济
学位
苏教版高中语文选修教科书中的在写荆轲刺秦时,司马迁这样写道:“未至身,秦王惊,自引而起,袖绝.拔剑,剑长,操其室.时惶急,剑坚,故不可立拔.”rn这是荆轲与秦王面对面搏击之时
时间在中国古典诗歌中既是重要的意象,也是意象组合的重要凭借,所以,在解读中国古典诗歌时把握时间元素自然就成了一种有效的手段.这个手段的作用或为对诗歌情感特征的分析,
立体视频和传统的单通道视频相比,要处理翻番的数据量,为了便于存储和传输,立体视频数据必须要进行高效的压缩。H.264是新一代视频压缩标准,具有更高的压缩比,更好的信道适应
秋风把草丛吹黄了,到了天黑的时候,冷冷清清的。咦,你听——小蛐蛐儿们吹出一嘟噜一嘟噜的口哨,又脆又响,还挺开心哩!小蛐蛐儿们真的开心吗?天气渐渐凉了,接着,寒冷的冬天就
期刊
经典背压式算法解决了网络架构中的路由选择与会话调度问题,提高了网络吞吐量,但是由于其网络结构模型并没有完全的分层,使得其在实际部署过程中存在一些问题。目前所使用的