论文部分内容阅读
光学公式识别技术作为将印刷体数学公式自动输入计算机的有效手段,可以弥补现有光学字符识别系统难以识别数学公式的不足,促进科技文献的数字化。本文针对光学公式识别这一有别于普通文本的二维模式识别、分析与重构问题的关键技术展开研究,包括公式字符与符号的切分与识别、公式结构分析与理解和公式重构等三个方面。主要工作如下:1.面向公式识别的需要,设计了对公式图像进行噪声去除、二值化、倾斜和变形校正的预处理方案,以改善识别性能。实验表明了该方案的有效性。2.针对与普通文本有很大差别的二维公式符号的切分问题,提出基于组合策略的公式符号自组织反馈切分算法,在切分过程中,根据识别情况对部件或符号进行合并或切分操作。针对符号粘连问题,通过对纵向粘连情况的归纳,提出基于符号知识的公式符号纵向粘连切分方法,对其进行智能切分,并设计了斜向和横向粘连符号的切分算法;融入“基于整体”的切分方法,对常见粘连符号,建立整体识别字典进行识别。实验结果表明,该方法具有较高的准确性。3.在公式符号识别中,在定义符号图像跳转函数表示法的基础上,提出基于跳转函数的方向线素特征快速提取方法,避免了耗时的轮廓提取操作,并设计了层次结构的公式符号识别器,有效地提高了符号识别的准确率和效率。4.在公式结构分析中,根据公式特点,提出融入几何信息的公式符号最大匹配分词算法,提高了符号串提取的准确性;针对传统结构分析方法存在的问题,提出基于语义的主基线定位方法,根据符号语义对符号关系进行智能分析以得到正确的基准符号;提出符号功能的模糊分类方法,将模糊逻辑应用于符号功能分析中,以适应公式在利用符号空间关系表达隐性运算关系时所存在的不确定性;提出动态的符号基线归属判别方法,根据符号综合特征判断其基线归属。上述改进措施提高了结构分析的准确性和适应性。5.在公式重构中,提出智能匹配的公式重构算法,根据所处理公式的特点选择LaTeX参数,实现了公式的准确重构。