论文部分内容阅读
图形符号识别是模式识别的一个重要分支,它在很多工程技术领域都有重要的应用研究价值。虽然不同图纸专业领域的符号识别算法所针对的对象不同,但是从整体看,它们可以大致分成相同的三个抽象层次:(1)基本元素的识别,即从像素到向量的转化,从而得到基本图元,如线段、圆等;(2)组合图元的识别,即将(1)中得到的若干基础图元作为一个有意义的整体进行识别;(3)整图的分析和识别,如三维模型重建、内容修复等。在这三个不同的抽象层次中,层次(2)的组合图元识别是重要的一环,对该层次的图形符号识别方法大致可分为统计法和结构/语义法两类,前者通过统计学方法使用大量样本训练模型再将以此来识别图形符号;后者先根据特定图形符号对象自身的结构以及与其它图形符号对象的关系信息来定义该类对象的结构知识,然后利用语义算法产生最终的识别结果。然而,它们自身都存在一些难以克服的问题:统计学的方法必须先通过大量的训练样本来训练模型才能达到适当的识别能力;结构/语义方法则需要相关每一类图形符号的先验知识,并根据这些知识进行提前的模板类建立或者知识预定义,这对图形符号数量巨大的工程图来说,几乎是不可能的。
因此,为了集合上述两者的优点同时避免它们的缺陷,本文提出了一种具有自学习机制的符号识别方法,该方法通过采用增量学习的形式,使得从数量有限的样本中就能自动地学习特定图形符号的知识,当同类符号再次出现时,又能够迅速、增量地更新已有的知识,通过这种方式来提高识别精度。以该方法为基础,本文设计并实现了基于自学习机制的符号识别系统,该系统由两个核心过程构成:模板学习和符号识别。模板学习是通过若干数量的同类符号的识别,自动、灵活地生成或更新模板的过程,符号识别是按模板数据库数据库的已有模板类从完整的工程图中识别出各种符号的过程。这两个过程互相支撑而融合成为一个整体,并具有三个特点:第一,模板确定策略中引入了机器学习过程;第二,模板学习过程中设定用户介入模式以提高学习的效率和正确性;第三,在符号识别结果的基础上有选择地进行模板学习和更新。同时,系统还引入了适当的用户反馈机制,针对漏识和误识采取了不同的策略,这也使得符号识别的结果能够更好地起到反馈的作用,从而得到更好的增量学习能力和识别结果。