论文部分内容阅读
脱机手写体汉字字符集具有数量大、结构复杂、相似字多和无规则变形严重等特点,使得脱机手写体汉字识别成为字符识别领域中最大的难题和最终的目标之一。而人类视觉感知是一个鲁棒性很强的、能抵御实际中各种变形和噪声干扰的具有良好容错性的文字识别系统。近年来,围绕仿人脱机手写体汉字图像识别的研究在很多方面已取得了重要进展,但在特征使用和识别方法上如何提高机器仿人识别手写体汉字图像的灵活性仍是值得研究的方法之一。
本文在对目前广泛采用的一些识别方法与前人工作进行了认真的学习和总结的基础上,做了一定的研究和实验工作,得出了一些有用的结论。
本文的主要工作如下:
1.手写体汉字图像的多模态识别。提出了一种图像汉字字型结构和部件繁简度的分类方法,给出了字型结构度类型的编码、汉字字型结构分解算法以及汉字部件繁简分类特征算法,实现了手写体汉字的字型结构度和部件繁简度的分类和提取,实验结果表明是可行的。
2.基于字型结构特征的仿人汉字识别系统设计。该系统采用决策控制级和模式识别级二级并行式结构,决策控制级根据辨识出的汉字模态选择最佳的识别策略和参数,模式识别级依据识别策略进行多分类匹配识别,有效地提高大类别汉字的识别率,提高汉字识别系统的实用性。
3.手写体汉字细分类识别法的原理介绍和特点分析。从统计和结构模式识别法出发,对实验室前期的研究成果-小波网格法、基于双权值椭圆神经元的仿生模式识别法、八形编码法和基于过程神经元笔段提取法的原理进行了分析,根据每种特征各自特点,选择最佳的识别策略和参数,实现多分类匹配识别。
4.二层三段式识别系统的应用。选取SCUT-IRAC手写体汉字库中的手写体汉字图像,以VC++和MATLAB6.5编程语言为实现手段,对多种类型手写体汉字图像(简单单部件、复杂单部件、左中右结构、左上下结构等)进行了验证实验。
本文研究表明:基于手写体汉字字型分解的多模式识别系统能够有效的对待识别汉字图像进行粗分类判断、最佳识别方案决策及多分类匹配识别。实验结果表明,该方法能够模仿人类对手写体汉字的繁简度和结构度的整体性和可分解性识别过程。