基于自学习机制的符号识别系统的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:hulin510
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图形符号识别是模式识别的一个重要分支,它在很多工程技术领域都有重要的应用研究价值。虽然不同图纸专业领域的符号识别算法所针对的对象不同,但是从整体看,它们可以大致分成相同的三个抽象层次:(1)基本元素的识别,即从像素到向量的转化,从而得到基本图元,如线段、圆等;(2)组合图元的识别,即将(1)中得到的若干基础图元作为一个有意义的整体进行识别;(3)整图的分析和识别,如三维模型重建、内容修复等。在这三个不同的抽象层次中,层次(2)的组合图元识别是重要的一环,对该层次的图形符号识别方法大致可分为统计法和结构/语义法两类,前者通过统计学方法使用大量样本训练模型再将以此来识别图形符号;后者先根据特定图形符号对象自身的结构以及与其它图形符号对象的关系信息来定义该类对象的结构知识,然后利用语义算法产生最终的识别结果。然而,它们自身都存在一些难以克服的问题:统计学的方法必须先通过大量的训练样本来训练模型才能达到适当的识别能力;结构/语义方法则需要相关每一类图形符号的先验知识,并根据这些知识进行提前的模板类建立或者知识预定义,这对图形符号数量巨大的工程图来说,几乎是不可能的。   因此,为了集合上述两者的优点同时避免它们的缺陷,本文提出了一种具有自学习机制的符号识别方法,该方法通过采用增量学习的形式,使得从数量有限的样本中就能自动地学习特定图形符号的知识,当同类符号再次出现时,又能够迅速、增量地更新已有的知识,通过这种方式来提高识别精度。以该方法为基础,本文设计并实现了基于自学习机制的符号识别系统,该系统由两个核心过程构成:模板学习和符号识别。模板学习是通过若干数量的同类符号的识别,自动、灵活地生成或更新模板的过程,符号识别是按模板数据库数据库的已有模板类从完整的工程图中识别出各种符号的过程。这两个过程互相支撑而融合成为一个整体,并具有三个特点:第一,模板确定策略中引入了机器学习过程;第二,模板学习过程中设定用户介入模式以提高学习的效率和正确性;第三,在符号识别结果的基础上有选择地进行模板学习和更新。同时,系统还引入了适当的用户反馈机制,针对漏识和误识采取了不同的策略,这也使得符号识别的结果能够更好地起到反馈的作用,从而得到更好的增量学习能力和识别结果。  
其他文献
Petri网作为一种严格定义的形式化数学模型,适合用来建模具有并发、异步和冲突的复杂信息系统。本文针对复杂多工序的钢铁制造流程,提出以时间参数为主轴,利用高级Petri网的随机
随着市场竞争的日益激烈,各行业需求的频繁变化,作为企业管理信息化、业务过程自动化的一项关键技术—工作流技术,其可靠性、完善性、可塑性、适应性研究成为当今研究热点之一。
I/O系统是计算机与外界交流的通道,从计算机系统诞生起就在计算机系统中占有重要地位,以TPC系列和SPECWEB系列为代表的I/O密集型应用已经成为计算机系统应用的重要组成部分。与
IMS(IP Multimedia Subsystem),即IP多媒体子系统,是基于IP网络的一种全新多媒体业务形式,被业内公认为是解决移动与固网融合,引入语音、数据、视频三重融合等差异化业务的核
图像分割是图像识别及恢复等后续操作的预处理步骤,它是从图形处理到图像分析的一个关键步骤,并且在计算机视觉、模式识别和医学图像处理等实际应用中得到了广泛的应用。所以,图
随着多媒体技术的发展、带宽的增加、移动用户数的大规模增长,用户对于终端体验的要求越来越高。富媒体技术以其涵盖丰富的媒体形式、实时性的交互式体验,成为满足这一需求的
无线传感器网络是过去10余年的一个热点研究领域。作为无线传感器网络中最重要的支撑技术之一,定位技术在过去的几年中也受到了广泛的关注。在本文中,主要作出了如下贡献:  
近年来,随着多媒体技术和网络技术的飞速发展,Internet成为了信息的主要载体,随着现代教育事业的蓬勃发展,远程教学也成为一种新型知识传播方式进入到人们生活中。远程教学可
学位
随着互联网的高速发展和图像信息的快速增长,从海量的数字图像集合中快速地提取出有价值的知识已经成为人们的迫切需求。自20世纪90年代起,基于内容的图像检索(Content-based