论文部分内容阅读
该文主要研究由重力加速度变化(如在飞机上)而引起的应力变异,在对应力变异语音有效分析的基础上,分别从基于特征和基于模型角度提出可以抑制应力变异影响的有效方法.从基于特征角度出发:首先针对变异环境中不同特征维受变异影响程度不同的特点,提出了MFCC特征加权方法.通过对变异情况不敏感的高维特征加较大的权值来加重其作用,而对变异环境中变化较大的低维特征用小的权值减弱其影响,来达到增强系统性能的目的.根据不同应用场合,提出基本权值、非线性权值和最大相对熵权值三种方案.其次,根据变异情况下语音产生过程中非线性程度增加的现象,提出了基于调幅-调频模型的顽健特征.该特征有效利用了语音信号中的幅值包络和瞬时频率信息,使系统识别率有一定提高.由于在调幅-调频模型中用到的Teager能量算子是处理语音产生过程中非线性现象的关键,因此单独利用Teager能量算子计算倒谱特征,并将其同加权思想相结合,进一步改进了该方法的性能.此外,在基于特征处理方法中,还提出了基于MFCC特征补偿的方法,对应用正常语音模型识别应力变异语音进行了有益的尝试.从基于模型的角度:由于应力变异的影响,语音识别模型参数会发生漂移,并且特征分布空间以及具体的分布轮廓都发生了变化.针对这种情况提出了自适应模型合并方法,在合理利用正常识别模型中所包含的语音信息的同时,还可以根据当前语音帧受变异环境的影响程度,合理调整混合模型中的比例因子,使其在正常语音识别模型和变异语音识别模型之间寻找最佳的平衡点.另外,通过将基于特征方法中的加权思想进行拓展,提出了一种加权似然测度方法,在计算发射概率时考虑到不同特征维的作用不同,用基本权值对其加权,达到对应力变异语音顽健识别的目的.将加权似然测度方法和自适应模型合并方法相结合后,系统性能得到进一步提高.最后,尝试了将广泛用于话者自适应的最大后验概率和最大似然线性回归方法用到变异语音的自适应中,获得了较好的系统性能.