论文部分内容阅读
脱机手写字符识别,尤其自由手写汉字识别,是模式识别领域中最具有挑战性的问题之一,至今仍然没有很好地解决。为此,本文基于统计方法,从特征形成和分类器设计两个方面开展了研究。主要的创新性内容如下:
(一)本文在总结几种重要特征形成方法的基础上,根据信号处理及模式识别的相关理论,分析了“模糊分块”提高特征可分性的原因,并提出了改进的特征——“低通采样方向线素特征”。实验证明该特征具有更好的可分性。
(二)为更好地拟合手写字符特征的类条件概率密度的非高斯分布,本文首次在字符识别中引入了“正交混合高斯模型”(OGMM)。据此,可以更精确地描述实际特征的类条件概率分布。实验证明,基于OGMM的分类器比基于高斯分布的分类器在字符识别中表现出更好的分类性能。
(三)为进一步获得更高性能的OGMM分类器,本文在OGMM参数估计中引入了“最小错误率鉴别学习”算法(MCE),提出并实现了基于MCE鉴别学习的OGMM(OGMM+MCE)。按照MCE鉴别学习算法,通过调整OGMM的参数,显著地减少了经验错误率。
(四)OGMM的阶数,即OGMM中高斯分量的个数,无法通过EM算法或MCE鉴别学习算法得到。由于OGMM的阶数控制着分类器的复杂度和推广能力,因此本文根据“结构风险最小化”原则,提出了一种确定模型阶数的方法。该方法可以得到合适的阶数,有效地防止“过拟合”和“欠拟合”。
(五)针对汉字识别模式类别多和运算量大的特点,为保证OGMM+MCE能够有效地应用于手写汉字识别,对原MCE算法进行了一系列必要的修正,使之在手写汉字识别的粗、细分类器中均得到了应用。
最后,通过在手写数字NIST库和MNIST库的实验和评估,表明利用本文OGMM+MCE算法设计的手写数字识别分类器,其性能己达到世界先进水平。在手写汉字THUHC库的实验结果表明,OGMM+MCE在手写汉字识别粗、细分类器中的应用均取得成功(本实验室多种识别方法中至今最好的结果)。