论文部分内容阅读
脱机汉字识别是模式识别的一个重要研究领域,是汉字信息处理的重要接口技术。经过几十年的研究,在印刷体识别、银行支票、邮政系统等方面取得了重要成果。但在整个OCR领域,尤其是自由手写体领域,目前在提高识别率方面还存在相当大的困难,成为该领域最具挑战的课题。论文做的主要工作如下:首先,对图像进行了预处理,去除与文字无关的信息,如色彩信息;针对一般文本图像,本文设计了一种算法,来获取文字前景图像。从效果上看,一方面,去除了较多的背景信息,另一方面,较好地保留了文字的信息。其次,综述了用于单个手写体汉字识别的特征,如轮廓特征、方向线素特征、网格特征、背景特征等。重点介绍了方向线素特征的提取方法以及基于统计的网格特征的研究成果,并分析了这些特征在文字识别方面的优劣性。然后对细化算法的分类进行了深入的探讨,如可以分为基于象素判断的算法和基于边缘侵蚀的算法。本文提出了一种基于保留骨架点的并行算法,该算法对图像细化有较好的效果。再次,对多行手写体识别的特点进行了研究,是文章的主要的研究成果。首先提出了连通分支的标记方法,由于该方法处理的数据量大,文章先对文本图像进行了行切分的预处理,有效减少了数据量,在得到行后,由于文字部件结构复杂,又提出了一种基于连通分支合并和分解的方法,得到了较佳的处理效果。最后,针对手写体普遍出现粘连,重叠的现象,综述了前人的成果,如角点检测算法,基于字符图像背景的切分算法。并从另一角度,即把整个文字图像看作一个图,对图像的切分看作是图到子图的断裂,从而最终实现粘连字符的切分。