论文部分内容阅读
传统的隐马尔科夫模型(HMM)的训练方法基于统计概率的最大似然准则(MLE),在训练样本数目足够大的情况下,这种方法在理论上可以得到最优的结果。在手语识别研究中,采集足够大的训练样本十分困难。区分性训练可以很好的弥补由于训练样本的缺乏以及手语模型之间的近似而造成的识别系统的缺陷。最大交互信息准则(MMIE)作为区分性训练准则的一种已经被广泛的应用于语音识别领域。 本文主要针对中国手语400个手势词进行识别算法的研究,在此基础上通过合理的构建手语识别中的竞争模型和易混集,提出了MMIE准则的改进形式,并将其应用于特定人与非特定人手语识别。主要研究工作如下: 1.在手语识别领域第一次引入了区分性训练的概念,将区分性训练与原始的MLE训练相结合组成新的识别系统框架。 2.详细讨论了在手语识别中基于扩展BW算法(EBW)的MMIE区分性准则的重估公式的推导过程,并对其中参数的设置给出了理论上的答案。 3.为了使区分性训练准则适应手语识别的特点,采用更一般化的MMIE准则H准则,并对用GD算法得到的参数重估公式进行了适当的改进。不但简化了计算的复杂性,而且克服了原公式因常数的加入而造成的不稳定性。通过大量的实验,给出了新的重估公式各参数的定性定量的分析,指出当h=1.7和迭代次数为4次时,算法的收敛速度和识别率都达到最佳。 4.为了合理的体现手语模型之间的交互信息,提出了在手语数据训练集上基于改进N-BEST算法的有效构造易混集的方法,并给出了具体的构造易混集的步骤。在此基础上又提出了一种基于训练集的组合筛选式的易混集构造方法。结合改进的区分性训练方法,这种易混集的构建方法能更好的体现模型之间的交互信息。 5.对MLE算法,EBW算法和新改进的算法给出了详细的比较试验结果。相对于MLE算法,在识别率上,EBW算法有微小的提高,而改进后的新算法有较大幅度的提高,在注册集和非注册集上分别得到了接近4%和9%的提高。证明了新算法的有效性。