论文部分内容阅读
本文首先研究了传统的光学字符识别(OCR)算法,对其处理过程进行了分析。并在此基础上对该算法的时间复杂度,空间复杂度以及正确率等重要特性进行了讨论。指出了该算法的正确率高等优点和运算复杂,对中央处理器(CPU)、内存等系统资源要求高的不足之处,为进一步的研究工作做好了准备。在研究的基础上,本文摆脱了原有的基于汉字结构特性的算法禁锢,提出了一种基于统计原理的新算法。该算法避免了对图形进行大量的处理工作,采用统计的方法来获取必要的信息。这样加快了程序运行速度,又保持了相当的正确率。为OCR软件向使用嵌入式系统的手持设备端进行移植做好了充分准备。并以VC平台为基础,使用编程语言对该算法进行了初步实现并在此基础上进行了大量的测试工作。文章分成Code部分和Decode部分,分两步对算法的思想进行了分析并对算法的流程进行了介绍,还着重进行了复杂度上的分析。测试结果表明,新的算法的正确性已经基本达到通常OCR软件的标准,在嵌入式系统最为敏感的时间复杂度问题上,也比原有算法有很大的改进。
从实用的角度出发,本文讨论了向手持设备端的移植问题。并着重讨论了在使用不同的编程语言的情况下,如何避免产生一些常见的问题。并提出了在移植过程中进行优化的思想,以改善该OCR算法的查找性能。