基于AdaBoost的复杂背景下场景文本的检测与识别

来源 :广东工业大学 | 被引量 : 1次 | 上传用户:yus520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景图像中的文本信息具有重要的价值,可以应用于图像检索、无人驾驶、视觉辅助等多个方面,是当前计算机视觉领域的热门研究课题。自然场景图像文本提取主要分为字符定位,字符合并,字符识别三个部分,其中字符定位是提取文字的关键步骤,对后面字符识别的准确率有重大的影响。虽然传统的OCR技术已经非常成熟,对文档图像文字的识别准确率达到将近百分之百,但是如果直接应用于自然场景图像的文字识别的话,效果会大打折扣,原因是文档图像一般分辨率高,文字清晰,与背景对比度高,基本不会发生倾斜变形;而自然场景图像中往往包含了大量复杂的背景纹理,并受到光照、字体、拍摄角度的影响,使得文本的定位与识别面临着重重的困难。  本文对自然场景文本检测与识别相关技术进行了研究,提出了一种基于最大稳定区域 MSER 和适应性提升算法 AdaBoost 的自然场景图像文本候选区域检测与识别算法,主要工作包括如下几个方面:  (1)根据自然场景图像的特点,设计了一种能够提高自然场景图像文本获取效率的预处理方法。预处理包括灰度化、平滑和锐化。灰度化可以简化图像,减少算法的计算量,提高算法处理速度;平滑使用了高斯模糊,平滑后可以去除图像的噪声,锐化则使用了拉普拉斯锐化算子,锐化可以加强图像的边缘,突出图像的细节部分。  (2)设计了一种基于最大稳定极值区域的自然场景图像文本候选区域提取方法,该方法通过提升二值化阈值的方法找到图像中的极值区域,计算这些极值区域的变化率得到文本候选区域。  (3)根据获得的文本候选区域的特征,提出了筛选文本候选的三种方法,分别是启发式规则过滤、笔画宽度过滤和基于AdaBoost的分类模型过滤。启发式规则过滤是根据候选区域面积,占空比特征来设定过滤规则;笔画宽度过滤是提取候选区域中文字的笔画宽度,将不符合笔画宽度大小的区域删除;基于AdaBoost的分类模型首先需要通过梯度直方图和局部二制模式提取候选区域的梯度和纹理特征,输入由决策树构成的弱分类器中学习得到分类模型,将候选区域分成文本区域和非文本区域,并采用了 ICDAR-2003图像集进行仿真实验,仿真结果表明,对于自然场景图像中的文字能够较准确地定位出来。  (4)设计了一种字符合并方式和基于Tessact的字符识别系统。通过数学形态的膨胀方法将图像中相近的字符连接在一起,通过连通域分析将连通的字符合并,调用Tesseract进行字符识别。最后进行了仿真实验,实验结果表明,该系统识别准确率较高,具有一定的理论意义和实用价值。
其他文献
一、纵向变题法图1题目如图1所示,水平传送带以5 m/s的恒定速度运动,传送带长s=7.5 m,今在其左端A将一工件轻轻放在上面,工件被带动,传送到右端B,已知工件与传送带间的动摩擦
讲解习题对于物理老师来说是一项很重要的技能.一般来说,只要老师讲得仔细、说得明白,学生就没有弄不懂的题目.可事实往往不尽人意:老师费尽口舌、学生费尽脑力,结果还是两不
前苏联数学教育家斯托利亚尔说过:“数学教学也就是数学语言的教学”.而“数学阅读”的思想也不断地被强调,如山东潍坊市高三统考就请学生结合某公交路线收支差额与乘客量的
无线复眼(WiME)导航是结合了生物学科发现和先进信息技术于一体的新型机器人导航方案。本文主要研究并实现了WiME中机器人跟踪定位的内容,为机器人运动伺服控制提供了实时的决策
洴田是一种低产稻田,分布于山区、丘陵地区的冲壠田里,这类田常年泉水迸流,水冷泥烂,土层过深,耕作困难,水稻生长不良,产量很低。一般亩产稻谷只两、三百斤。改造洴田对于实
一、问题的提出三角函数的学习是在高一的上半学期.许多学生对任意角的三角函数的定义普遍感到难以接受.因为初中研究的范围内角的正弦,余弦,正切值都是正数.教师反复强调要
在新课改背景下,教师要不断尝试新的教学方法和教学手段等,以此来提升数学教学的有效性.同时,教师也要做好课堂的有效性延伸,尤其是对于高中数学教学来说,更应该结合教学内容
应英国皇家学会邀请,我院党委书记王镇恒教授于1988年6月26日赴英国参加全英皇家第六届国际农业专题学术讨论会。会议中心议题是:农业工业化的前程。会议围绕全世界随着人口
在当今的制造领域,越来越多柔性制造系统已经取代了传统的大批量单一种类加工制造系统,而现代企业也越来越多地把柔性制造系统作为提高他们竞争能力的有效手段。因此,怎样能够更好的控制柔性制造系统的加工流程,使得系统中的工件能够更快速,更安全的完成加工流程一直以来都是学术界和工业界关注的重点之一。在这种高度自动化的柔性制造系统中,资源高度共享。当工件进入系统并竞争有限资源时,如果缺乏有效的调度和控制方法,就
物理学是自然科学中的一门基础学科,主要研究物体的运动规律,而高中物理教学是建立在学生的有限能力水平基础上,把自然现象简单化,即建立物理模型,是高中学习物理的重要手段.