光学公式识别技术研究

被引量 : 6次 | 上传用户:kongfuhei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光学公式识别技术作为将印刷体数学公式自动输入计算机的有效手段,可以弥补现有光学字符识别系统难以识别数学公式的不足,促进科技文献的数字化。本文针对光学公式识别这一有别于普通文本的二维模式识别、分析与重构问题的关键技术展开研究,包括公式字符与符号的切分与识别、公式结构分析与理解和公式重构等三个方面。主要工作如下:1.面向公式识别的需要,设计了对公式图像进行噪声去除、二值化、倾斜和变形校正的预处理方案,以改善识别性能。实验表明了该方案的有效性。2.针对与普通文本有很大差别的二维公式符号的切分问题,提出基于组合策略的公式符号自组织反馈切分算法,在切分过程中,根据识别情况对部件或符号进行合并或切分操作。针对符号粘连问题,通过对纵向粘连情况的归纳,提出基于符号知识的公式符号纵向粘连切分方法,对其进行智能切分,并设计了斜向和横向粘连符号的切分算法;融入“基于整体”的切分方法,对常见粘连符号,建立整体识别字典进行识别。实验结果表明,该方法具有较高的准确性。3.在公式符号识别中,在定义符号图像跳转函数表示法的基础上,提出基于跳转函数的方向线素特征快速提取方法,避免了耗时的轮廓提取操作,并设计了层次结构的公式符号识别器,有效地提高了符号识别的准确率和效率。4.在公式结构分析中,根据公式特点,提出融入几何信息的公式符号最大匹配分词算法,提高了符号串提取的准确性;针对传统结构分析方法存在的问题,提出基于语义的主基线定位方法,根据符号语义对符号关系进行智能分析以得到正确的基准符号;提出符号功能的模糊分类方法,将模糊逻辑应用于符号功能分析中,以适应公式在利用符号空间关系表达隐性运算关系时所存在的不确定性;提出动态的符号基线归属判别方法,根据符号综合特征判断其基线归属。上述改进措施提高了结构分析的准确性和适应性。5.在公式重构中,提出智能匹配的公式重构算法,根据所处理公式的特点选择LaTeX参数,实现了公式的准确重构。
其他文献
OCR (Optical Character Recognition,光学字符识别)技术可以方便、快捷地将印刷文档转化为计算机中的电子文档,并且结合模式识别技术实现对电子文档中一些字符的识别。构建
近年来中央和地方都在为构建和谐社会而努力,构建和谐社会尤其要关心困难群体,困难群体工作做得如何是考量城市文明的重要指标。农村残疾人是人类社会一个特殊的弱势群体,是
目的:探讨磁共振扩散加权成像在宫颈癌诊断、鉴别盆腔转移与非转移淋巴结中的应用价值以及预测、监测宫颈癌放化疗近期疗效的可行性,并筛选出早期监测疗效的最佳时间点;分析最
目的探讨脑内毛细胞型星形细胞瘤的MRI表现及误诊原因。方法对经手术病理证实的5例脑内毛细胞型星形细胞瘤的临床资料及MRI表现进行回顾性分析。结果 5例病灶分别位于小脑后
4-三氟甲基烟酸是含三氟甲基芳香化合物,具有独特的生物活性,它可以作为制备其他农药或医药的前体物质。而它的衍生物4-三氟甲基烟酰胺类化合物也有着重要的用途,可以作为杀
电力系统的操作票制度是保证电力系统安全、稳定运行的重要措施。随着电网、电厂的接线逐渐复杂,规模逐渐增大,传统的手工写票已经不能满足电力安全生产的要求。电力系统操作
合作金融以合作制原则为基础,通过联合互助为社员提供金融服务,农村信用合作社是合作金融的在农村地区的具体金融组织形式。贵州省作为全国首批深化农村信用社改革试点的省份
采用研发饲料和市售商品饲料在池塘高密度养殖罗非鱼过程中对罗非鱼生长性能及养殖水体水质指标的影响研究。结果表明:投喂研发饲料的池塘生长性能较市售商品饲料差异显著(P<
目的利用改良的葡萄糖-6-磷酸脱氢酶测定试剂盒(定量比值法)检测斑马鱼不同组织、不同时相胚胎的G6PD酶活性。利用基因重组等技术构建g6pd-pCS2+、mutant g6pd-pCS2+、g6pd-EGF
国家新一轮课程改革的核心是从根本上改变教师的教学方式和学生的学习方式。探究式教学是新课程实施中被倡导的教学方式之一,它能从根本上改变学生的依赖与模仿,引导学生动手