基于自然场景的图像文字识别

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:z814521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学、人工智能以及多媒体技术等学科的发展,以及各类具有摄像功能的移动电子设备逐渐普及,使得越来越多的信息载体以图像形式存在。图像中的文本识别对于基于内容的图像检索具有重要意义,这些文字信息成为了理解图像内容的重要线索。而自然场景中存在着大量的文字信息,这些信息的获取有利于场景内容的描述与理解。  本文主要针对自然场景中文字识别的相关技术进行研究,总结了国内外在文字定位和提取技术以及文字识别方面的研究成果,重点探讨识别过程中各个步骤的实现过程,并对现有的一些算法进行改进,并最终实现了自然场景中的文字提取以及识别。  本文主要的研究工作有:  (1)利用数字图像处理技术对图像进行预处理,并改进了基于直方图均衡化的图像增强算法以及基于直方图分析和OTSU二值化算法;  (2)基于匹配小波的概念,提出了一种结合小波和马尔科夫模型的文本定位方法;  (3)融合图像处理,改进了Google的字符识别工具Tesseract的识别率。  根据以上提出的各类算法,本文建立了一个自然场景文字识别系统。实验结果表明,本文所提出的文字识别算法可以较为准确的定位和识别出自然场景下彩色图片的文字信息,具有一定的理论价值和较高的实用价值。
其他文献
近年来,Internet技术和应用获得始料不及的发展。IP网中传输的信息已由单纯的文本数据演变到丰富多彩的多媒体信息(如语音、图像图形、实时视频等)作为因特网上的电话服务,IP电
WAP(Wireless Application Protocol)是无线应用协议之意,它融合了移动通信和Internet两项技术。它充分考虑了无线信道的固有特点(如信道稳定性差、衰减干扰大、带宽窄、时延
防火墙是一种保护本地系统和网络,抵制基于网络的安全威胁,同时提供通过广域网和因特网对外界进行访问的有效方式。防火墙是一种有效的防御措施,它能增强内部网络的安全性,能够防
本文的主要工作是在对几种典型的多用户检测中技术研究的基础上,着重探讨基于信号子空间的多用户检测技术,并对其性能进行仿真分析。全文内容主要分为以下几个部分: 1.简要回
随着科技的日新月异,个人计算机和互联网的普及,无线应用的广泛深入,多媒体技术也得到了长足的发展.从Motion JPEG发展到了Motion JPEG2000.Motion JPEG2000是新的无帧间编码
并行处理是指同时对多个任务或多条指令、或多个数据项进行处理,从而大大提高计算速度。实现这种并行处理的计算机系统称为并行计算机系统。并行计算采用并行程序实现,并行程序
本文重点研究了宽带流媒体应用的解码、宽带流媒体服务器、流媒体传输的质量控制等关键技术问题。作者提出了宽带流媒体服务器的直接访问并行IO体系结构-PPA ,并对PPA体系结构
目前所见到的自动调制制式识别的文章都是基于某一方面的,如:基于恒包络的调制(CW、FSK、PSK),基于多进制的QAM调制(4QAM、8QAM、16QAM)和基于多进制的MFSK、MPSK调制等,没有覆盖
在许多数字通信的应用中,传输的数据比特序列都由不同的重要性,因此产生了一些不等误差保护方案。H.263的基准句法结构对信道干扰非常敏感,通过试验我们可以得到在传输速率在32k
本文首先介绍了PACS系统的概念,然后对它的系统组成,相关技术以及规模特点等做了系统的描述。在随后的章节中我们主要介绍了对于构建PACS系统极为重要的DICOM通信协议,介绍了它