【摘 要】
:
文字识别技术在文档管理、图像理解、视觉导航等中具有重要应用。然而,自然场景中的文字通常排列任意、形状不一、字体多样,难以被检测和识别。提出了面向自然场景图像的三阶
【机 构】
:
中南大学计算机学院,湖南省机器视觉与智慧医疗工程技术研究中心
【基金项目】
:
国家自然科学基金资助项目(61902435),科技部重大项目(2018AAA0102102),湖南省科技计划项目(2017WK2074),教育部学科创新引智基地项目(B18059),湖南省自然科学基金资助项目(2019JJ50808),2020年大学生创新创业训练计划支持项目(GCX2020325Y).
论文部分内容阅读
文字识别技术在文档管理、图像理解、视觉导航等中具有重要应用。然而,自然场景中的文字通常排列任意、形状不一、字体多样,难以被检测和识别。提出了面向自然场景图像的三阶段文字识别框架,该框架包括文字检测、文字矫正和文字识别。首先,利用特征金字塔网络分割图像中的字符,基于双向长短期记忆网络获取字符间的亲和度,连接孤立字符构建单词行,文字检测率(F分数)高达91.97%。然后,通过多目标矫正网络矫正被检测文字,以应对场景图像文字的复杂形变,增强阅读性。最后,通过注意力序列识别网络按序输出预测结果,实现单词级识别,文
其他文献
随着科学技术的不断创新与发展,越来越多的先进技术在工程测量中得到了应用,并且获得了良好的应用效果,其中就包括典型的全球卫星定位系统。为了深入研究全球卫星定位系统在工程测量中的实践运用表现,可以通过介绍系统类型、特点、工作原理以及运用方面,加深对全球卫星定位系统的认识与了解,进而在工程测量中更好地进行运用。与传统的人工测量相比,全球卫星定位系统的运用具有定位准确、测量精度高、操作简单、耗时少、测量站
近年来,随着社会基础设施建设的增加,我国的公路建设不管是速度还是规模都发展很快,为促进社会经济进步发挥着重要作用,但公路建设过程中,施工安全问题和公路的运行安全问题
珠江水环境持续恶化,寻求应对良策,探索建立流域协商机制途径,确立“善治”目标,得到流域内各省区政府及社会各界的共识。本文通过阐述建立珠江流域协商机制(协商组织)的必要性,认为
文章主要从语义角度论英语习语的翻译。首先,以蒙太古理论的核心“模型”为基础,从形式结构来看英语习语的汉译;其次,按照Gibbs对习语的分类,结合实例,对英语习语类别进行了分析,以
备受关注的物权法草案从倡议到五审已历时十二年。其间,有关修订和审议的纷争此起彼伏,既反映了物权法立法的艰难,也反映了多冗化利益整合的复杂。水权在总体上属于物权范畴,分析