论文部分内容阅读
字符识别是模式识别的一个重要分支,它涉及模式识别、图像处理、数字信号处理、人工智能、模糊数学、信息论、计算机等学科,是一门综合性技术。而汉字识别的基础是预处理,预处理结果的好坏直接影响着汉字识别效果的好坏,因此预处理在汉字识别的研究中占有非常重要的地位。汉字的笔段网格字形描述方法以颗粒度适中,无歧义,规范化的笔段对汉字字型进行描述并给出了字形的比对计算方法。该方法能描述一切可能的汉字,包括错字,异体字,拼合字等特殊汉字,更重要的是支持汉字字形的整体、局部特征的自动比对计算处理。主要有两种方法提供该方法要识别的数据,即笔段网格字形。一是在笔段网格中描绘字形,二是手写字。前一种方法能直接得到待识别的数据,但是由于笔段的方向和长度是预先定义好的,导致在笔段网格中描绘汉字不自然,不方便,效率低下。后者虽然需要一个规整化过过程才能得到笔段网格字形,但是手写字的书写符合人书写的习惯,自然,效率高,这样人和机器都能做自己擅长做的事。本文重点讨论手写字预处理,笔画间相互位置关系,手写字到笔段网格字形的规整化处理和可视化调试平台。具体工作如下:1.详细介绍了手写字识别技术的发展和现状及问题。2.详细介绍了联机手写字的预处理过程,为笔画关键点的提取及规整化工作奠定了良好的基础。3.通过介绍图形间相对位置关系和汉字笔画、部件间相互位置关系,提出了适合本课题的笔画间相对位置关系。这种关系直接主导着规整化方法的使用。4.提出了两种规整化方法,一是根据笔画规整关系,二是根据关系规整笔画。并建立了相应的可视化调试平台,其有利于程序的调试工作,提高了程序的开发效率。