应力变异语音分析及识别方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhangqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要研究由重力加速度变化(如在飞机上)而引起的应力变异,在对应力变异语音有效分析的基础上,分别从基于特征和基于模型角度提出可以抑制应力变异影响的有效方法.从基于特征角度出发:首先针对变异环境中不同特征维受变异影响程度不同的特点,提出了MFCC特征加权方法.通过对变异情况不敏感的高维特征加较大的权值来加重其作用,而对变异环境中变化较大的低维特征用小的权值减弱其影响,来达到增强系统性能的目的.根据不同应用场合,提出基本权值、非线性权值和最大相对熵权值三种方案.其次,根据变异情况下语音产生过程中非线性程度增加的现象,提出了基于调幅-调频模型的顽健特征.该特征有效利用了语音信号中的幅值包络和瞬时频率信息,使系统识别率有一定提高.由于在调幅-调频模型中用到的Teager能量算子是处理语音产生过程中非线性现象的关键,因此单独利用Teager能量算子计算倒谱特征,并将其同加权思想相结合,进一步改进了该方法的性能.此外,在基于特征处理方法中,还提出了基于MFCC特征补偿的方法,对应用正常语音模型识别应力变异语音进行了有益的尝试.从基于模型的角度:由于应力变异的影响,语音识别模型参数会发生漂移,并且特征分布空间以及具体的分布轮廓都发生了变化.针对这种情况提出了自适应模型合并方法,在合理利用正常识别模型中所包含的语音信息的同时,还可以根据当前语音帧受变异环境的影响程度,合理调整混合模型中的比例因子,使其在正常语音识别模型和变异语音识别模型之间寻找最佳的平衡点.另外,通过将基于特征方法中的加权思想进行拓展,提出了一种加权似然测度方法,在计算发射概率时考虑到不同特征维的作用不同,用基本权值对其加权,达到对应力变异语音顽健识别的目的.将加权似然测度方法和自适应模型合并方法相结合后,系统性能得到进一步提高.最后,尝试了将广泛用于话者自适应的最大后验概率和最大似然线性回归方法用到变异语音的自适应中,获得了较好的系统性能.
其他文献
在信息时代,如何保证信息系统及时可靠地提供服务是信息主管部门必须面对的重大课题.随着计算机和网络技术的迅速发展,构建高可用系统,提供稳定、可靠、有效、持续运行的计算
复制机制被大量地应用到Internet中用来提高对Web文档的访问效率,并增强Web文档有效性、降低网络总流量、保持系统负载均衡的功能。大规模使用复制技术必须考虑两个关键问题:
宽带多业务接入网络可以在一个平台上提供多种类型的服务,相比单独建立多个专用业务类型的接入网络具有运营管理维护成本更低,网络铺设费用更低,灵活性更好和网络利用率更高的优
唇读是用计算机再现聋人通过唇动破解语言规律读懂语言的过程,这是一项非常具有挑战性的科学发现,同时也可以用作语音识别的一种辅助手段,以提高自动语音识别抗噪声能力.唇读
在数据网格中,为了在在范围内共享巨大数量的数据资源,提高系统的运行效率,提高数据访问的可靠性,优化数据访问的性能,必然要涉及大量数据文件的复制、传输.既然存在复制,那
Web服务作为新一代分布式技术,它的松散耦合性、跨平台、跨语言、良好的互操作特性已为许多专家拥护并得到广大 IT公司和组织的支持。Web服务技术的应用是全球网络化高速发展
该文在系统分析了现有的视频检索技术的基础上,提出了在场景层次上综合多模态信息来分析视频内容的方法.对多模态、场景的概念、多模态综合的理论和意义以及如何综合多模态来
该文通过机器人部队(群机器人)追捕一个和多个猎物的过程来研究多个有限理性智能体在动态复杂环境下的最优合作机制与决策算法.具体研究以下几个主要方面:首先,提出多智能体
随着应用的深入和计算技术的发展,并行计算在数值计算领域里扮演着越来越为重要的角色,成为了解决很多大规模科学计算问题的唯一途径。 并行计算的应用离不开并行软件的支持
本文在分析和研究当前计算机辅助教学(CAI)状况的基础上,采用积件化的设计思想,研究和开发了基于Authorware的多媒体课件自动生成系统。该系统将课件的内容和结构分离开,为教师