面向自然场景图像的三阶段文字识别框架

来源 :浙江大学学报:理学版 | 被引量 : 0次 | 上传用户:dahaneralpha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文字识别技术在文档管理、图像理解、视觉导航等中具有重要应用。然而,自然场景中的文字通常排列任意、形状不一、字体多样,难以被检测和识别。提出了面向自然场景图像的三阶段文字识别框架,该框架包括文字检测、文字矫正和文字识别。首先,利用特征金字塔网络分割图像中的字符,基于双向长短期记忆网络获取字符间的亲和度,连接孤立字符构建单词行,文字检测率(F分数)高达91.97%。然后,通过多目标矫正网络矫正被检测文字,以应对场景图像文字的复杂形变,增强阅读性。最后,通过注意力序列识别网络按序输出预测结果,实现单词级识别,文
其他文献
随着科学技术的不断创新与发展,越来越多的先进技术在工程测量中得到了应用,并且获得了良好的应用效果,其中就包括典型的全球卫星定位系统。为了深入研究全球卫星定位系统在工程测量中的实践运用表现,可以通过介绍系统类型、特点、工作原理以及运用方面,加深对全球卫星定位系统的认识与了解,进而在工程测量中更好地进行运用。与传统的人工测量相比,全球卫星定位系统的运用具有定位准确、测量精度高、操作简单、耗时少、测量站
近年来,随着社会基础设施建设的增加,我国的公路建设不管是速度还是规模都发展很快,为促进社会经济进步发挥着重要作用,但公路建设过程中,施工安全问题和公路的运行安全问题
珠江水环境持续恶化,寻求应对良策,探索建立流域协商机制途径,确立“善治”目标,得到流域内各省区政府及社会各界的共识。本文通过阐述建立珠江流域协商机制(协商组织)的必要性,认为
文章主要从语义角度论英语习语的翻译。首先,以蒙太古理论的核心“模型”为基础,从形式结构来看英语习语的汉译;其次,按照Gibbs对习语的分类,结合实例,对英语习语类别进行了分析,以
备受关注的物权法草案从倡议到五审已历时十二年。其间,有关修订和审议的纷争此起彼伏,既反映了物权法立法的艰难,也反映了多冗化利益整合的复杂。水权在总体上属于物权范畴,分析