基于图像中文字检测和抽取技术的图像内容理解及其应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：woainiwgy

【摘要】

：

随着数码相机、数字摄像机和手机摄像头等数码产品的日益普及，人们获取图像和视频的方式越来越多，图像和视频的数量急剧增长。而个人PC和互联网的快速发展，使得图像和视频成为日

【作者】

：

张阳

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2013年期

【关键词】

：

复杂背景文字检测抽取技术自适应角点融合图像处理 SVM分类器

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着数码相机、数字摄像机和手机摄像头等数码产品的日益普及，人们获取图像和视频的方式越来越多，图像和视频的数量急剧增长。而个人PC和互联网的快速发展，使得图像和视频成为日常生活中信息交流和传递的重要载体。如何让计算机自动理解并利用图像和视频等多媒体文档的内容，已经成为当前图像处理和多媒体领域研究的热点。相比颜色、纹理、形状等底层图像特征，图像和视频中嵌入的文字通常与图像内容直接相关，如果能检测、抽取并识别出图像中的文字，则能够为图像和视频的内容理解提供重要的线索。传统的字符识别技术能够有效处理高质量的扫描文档，但是当图像中包含复杂背景，文字只占一小部分的情况，便会遇到很多困难，导致性能下降，甚至不能处理。因此，我们需要从理论和技术上提供有效的解决方案。本文针对复杂背景中的文字检测和提取问题展开研究，主要内容包括:　　第一，针对复杂背景中的视频文字，本文提出一种基于自适应角点融合的文本检测算法。该方法主要利用图像中的角点来定位和检测文字区域。我们利用灰度变化和边缘分布定义图像复杂度，再依据图像复杂度来进行角点检测和自适应角点融合得到文字候选区域，然后利用边缘投影分析来精确定位文字区域，最后通过SVM分类器对文本进行分类，去除误检区域。通过在视频数据集的实验，表明本文提出的方法具有召回率高，算法速度快的优势。　　第二，针对图像或者视频帧中的叠加文字，本文提出一种基于随机森林的文本检测方法。该方法将文字检测分为文本行粗检测和文本行验证两个步骤。在粗检测环节首先利用MVD彩色边缘检测和BST局部二值化方法得到二值边缘图，再利用边缘密度分布去除简单的背景，然后依据文本区域的几何和颜色特性的连通域分析得到文本行的候选区域位置。文本验证在粗检测的基础上，过滤背景噪声，提高检测算法的准确率。我们提出一种基于随机森林分类器的文本行验证算法。已有研究表明随机森林分类器对不均衡样本分类具有较好的泛化能力，正好符合文本行和非文本行样本的特点，我们提出用随机森林融合不同物理意义的特征进一步提高分类验证的性能。通过在多个数据集上与其他现有方法的比较，表明了本文提出的文本检测算法的有效性。　　第三，针对复杂背景中的文字抽取问题，本文提出一种整合局部信息的文本抽取算法。该方法将文字抽取看作一个噪声过滤的过程。经过观察，我们将文本行中的噪声分为:文字区域噪声和复杂背景噪声。其中文字区域噪声是指文字笔划上的噪声，多为质量退化或者光照不均引起的随机噪声，复杂背景噪声则是由与字符纹理灰度相似的背景造成的。我们利用边缘增强，结合局部灰度和空域信息进行二值化，去除文字区域噪声，并尽量分离背景和噪声，然后再利用基于文字特性的连通域分析，去除复杂背景噪声。通过在实验图像和真实数据集的算法测试，验证本文提出的文字抽取算法的有效性。

其他文献

功能安全温度变送器研究与开发

我国当前工业生产形势严峻，生产事故造成重大经济损失，严重影响经济发展和社会进步，因此系统的安全性变得极为重要。现在自动化技术已成为确保安全生产的有效科技手段。安全仪表

学位

功能安全温度变送器安全仪表系统生命周期风险评估模型第三方认证

玻璃基板搬运机器人参数辨识与误差补偿方法研究

玻璃基板搬运机器人主要应用于洁净自动化装备制造行业，实现玻璃基板在洁净环境下的自动化传输。这种机器人可适应洁净环境，具有对应玻璃基板尺寸的专用末端执行器，并可承受相应

学位

玻璃基板搬运机器人参数辨识绝对定位误差误差补偿

分布式系统中死锁与互斥问题研究

分布在网络中的各个进程的协同工作是分布式实时系统中非常受关注的一个方向，通常分布式系统中使用同步与并发控制来实现各个进程的协同工作。同步与并发控制的目的在于解决多

学位

分布式系统信息管理系统死锁检测互斥算法

基于WSN的输电线路监测网络MAC协议和路由算法研究

无线传感器网络改变了人与自然的交互方式，在军事、环境、医疗、家庭、工业等领域有广阔的应用前景，是二十一世纪最具影响的IT技术之一。基于无线传感器网络的输电线路在线监测

学位

无线传感器网络输电线路监测MAC协议路由算法

移动式机器人室内环境探索与自主导航问题的研究

移动机器人是一种能够通过传感器感知工作环境信息和自身状态进而实现自主运动并完成一些预定任务的智能系统。环境探索与自主导航是移动机器人实现自主控制的关键技术，因此，如

学位

移动机器人信息熵动态可增减SOM图虚拟子目标主动寻径

水上无人机建模与起飞控制研究

水上无人机是指能在水面自主起飞降落的固定翼无人飞机，根据外形特征分成船身型水上无人机和浮筒型水上无人机两类。作为一种可水面起降的特殊无人机，其民用和军用前景广泛，研究

学位

水上飞机无人机水动力建模自主起飞控制自抗扰控制

面向硬实时工业无线网络的高精度时间同步方法研究与实现

工业无线网络技术是一种面向工厂设备间信息交互的无线网络技术。工业无线网络以其低成本、易使用、易维护等特点，已成为降低工业测控系统成本、扩展应用范畴的革命性技术。然

学位

工厂自动化时间同步原型系统工业无线网络预测补偿

基于FPGA的工业预测控制器开发与应用

因为具有灵活的约束处理能力和良好的控制性能，预测控制过去30年在过程工业中得到了成功应用。目前，预测控制的应用主要依靠工业控制计算机和专用控制软件，其实施和维护都需要专

学位

预测控制FPGA电路设计循环流化床锅炉节煤优化注塑机保压控制

可变形体模特机器人控制平台研究与实现

随着机器人技术的不断发展，机器人的应用领域也越来越广泛，机器人在服装设计和网络购物中开始得到应用。模特机器人是应用于服装设计和网络购物的一类仿人机器人，它可以通过控制

学位

CAN总线分布式控制以太网LwIP协议模特机器人

选矿过程生产指标多目标优化决策算法软件研发

在选矿生产过程中,企业生产指标对不可再生的矿物原料资源利用率、选矿企业产品的质量和经济效益是非常重要的。选矿过程的工况变化频繁,参数时变、关键生产指标不能在线实时

学位

选矿过程综合生产指标全流程生产指标多目标优化算法决策软件

基于图像中文字检测和抽取技术的图像内容理解及其应用

其他学术论文