【摘 要】
:
随着移动电子设备在日常生活中的广泛使用,人们可以方便快捷地通过拍照获取图像,而图像中往往包含着内容丰富的文字信息,基于摄像头的应用产生了大量对拍摄场景内容理解的需求。
论文部分内容阅读
随着移动电子设备在日常生活中的广泛使用,人们可以方便快捷地通过拍照获取图像,而图像中往往包含着内容丰富的文字信息,基于摄像头的应用产生了大量对拍摄场景内容理解的需求。图像中的文字作为一种重要的语义信息,是描述和理解客观世界相关环境的关键要素,正确识别这些文字对于人们的拍摄意图、基于内容的图像检索和分享、过滤等应用有着重要的现实意义。虽然针对传统扫描文档图像的OCR方法已经获得了很大的成功,但这种成熟的技术不一定适用于自然场景图像中的文字识别。由于自然场景图像受到多方面干扰因素的影响,大大增加了正确识别文字的难度。 考虑到场景图像中文字的特点,对其进行识别时,直接利用已有的OCR软件很难获得良好的识别效果。而传统的场景文字提取工作中,往往分为文本检测、文字分割和文字识别三个部分,从而造成文字的识别由于分割不准确而误识较多。近年来,学术界开始关注一种新的文字提取方法,即文字的检测、分割和识别同时进行不再明显分开。针对场景图像中英文单词识别的复杂性,本文在学者们新近研究成果的基础上采用这种方法,即当定位到文本区域后,在矩形区域内同时检测和识别字符而不进行分割,然后按照一定的规则将识出字符组合成单词,提取文字表示的确切信息。 本文提出了一种基于HOG和多元语言模型的场景单词识别方法。首先对训练样本字符图像进行预处理并提取HOG特征,然后基于多尺度分解和滑动窗口密集扫描测试单词图像,提取可能是字符位置的检测窗口的HOG特征,再利用最近邻分类器进行字符识别,最后根据提出的多元语言模型将识出字符组合成单词。实验结果表明,该方法具有一定的鲁棒性。
其他文献
近年来,随着全球信息化步伐的日益加快,计算机网络技术的发展与应用倍受社会各界的关注和重视,越来越多的企业,特别是大型企业建立了自己的计算机网络,以加强自身获取和处理信息的
随着我国气象部门信息化工程的建设和发展,各研究机构都建立了各自的信息处理系统,而这些信息系统却是在建立在不同的平台上,使用不同的语言进行开发的,数据库的模式也不尽相
互联网源于美国国防部的ARPANET计划。后来ARPANET与美国国家科学基金会州SF建成的NSFNET互联,并且开始了与加拿大、欧洲和太平洋地区的网络连接,这就是如今遍布全球的互联网的
电子商务系统服务质量的提高和营运成本的降低都离不开其性能的分析与优化。而现阶段对电子商务系统性能分析的研究大多偏于理论方面,且可操作性不强,分析模型单一。为给电子商
对象请求代理(Object Request Broker,ORB)是分布对象计算的心脏,它使得许多麻烦而易错的分布式编程任务得以自动化。ORB作为一个“软总线”来连接网络上的不同对象,提供对象
计算机模拟在当代化学、生物学、制药学以及流体力学等科学领域的研究中都扮演着不可替代的作用。通过对介观层面上的颗粒以及分子的模拟,可以大大地缩短这些科学研究方法的周
随着并行计算技术的发展,越来越多的程序是基于并行模型开发的,而且它们会被托管运行在SMP虚拟机平台上,这就要求宿主机平台能够提供高效的虚拟机管理功能。其中,开源虚拟机监视
计算机网络的高速发展给计算机网络管理提出了更高的要求。在早期互联网并未充分地考虑其安全问题,但今天安全问题愈加突出,成为研究热点和业界瞩目的焦点。为了解决计算机网络
电力行业是国民经济的支柱产业,为提高电力运营的经济性和可靠性,需要在规划选址、经济运行中综合考虑诸多关联因素。电力系统中存在各种输变电设备状态监测系统用于提高运行稳定性。各种输变电设备状态监测系统在长期运行中积累了大量历史数据。合理利用这些历史数据,对于帮助电力系统决策人员做出科学的决策具有重大意义。考虑到各种电气设施分布在广阔的地域空间上,导致从这些设备采集到的运行数据多包含地理属性。为有效对这
随着计算机技术的不断发展以及其软硬件的更新换代,越来越多的人开始使用计算机对图像做各式各样的处理。图像处理技术也在迅速的发展,其应用范围也不断拓展,例如机器人视觉