网络图像中合成文本检测及版面分割方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:boat_y
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、智能手机和通信技术的迅速发展,互联网(包括移动互联网)上多媒体数据快速增长。文字作为一种普遍使用的交流工具,经常被人工添加到图像中以传递信息,并在网络(例如:微博、微信和购物网站等)上广泛传播。因此,图像文本内容的识别与理解对于有效地利用网络信息具有重要意义,并受到了学术界和工业界的广泛重视。  图像文本识别系统包含文本检测、版面分割和文本识别。由于网络图像背景复杂、颜色多变、多语言混杂、图文混合并且版面复杂,文本检测和版面分割面临一系列技术挑战。本文结合图像处理、模式识别和概率图模型等相关领域的技术,对网络图像中的合成文本检测与版面分割进行了深入的研究。相比现有方法,本文所提出的方法在精度、召回率等方面具有一定的优势。本文主要研究工作和贡献如下:  提出了一种基于局部对比度分割的网络图像合成文本检测方法,充分利用了网络合成文本图像的特点。该方法首先通过分别检测笔划轮廓与笔划内部区域的策略获取候选文本部件,随后利用文本/非文本部件分类器过滤非文本部件,最后基于启发式的规则连接文本部件获得文本行,并利用文本行验证过滤非文本行。在提取候选文本部件时,该方法首先采用局部对比度阈值分割将图像分成光滑和非光滑区域。光滑区域中包含笔划内部区域,而对非光滑区域进行局部二值化可分离笔划轮廓和背景轮廓。将候选笔划轮廓和候选笔划内部区域予以合并,即获得候选文本部件。在公开数据集上的实验结果表明,本文提出的方法与现有最好的方法具有可比性。  提出了一种基于条件随机场(Conditional Random Field,CRF)的多方向文本行提取方法,采用先将部件聚成行再过滤非文本部件的策略,以避免一开始就误过滤文本部件。在获得候选文本部件后,该方法首先连接部件构建最小生成树(Minimum Spanning Tree,MST),随后采用由粗至精的思路判断MST中每条边连接的部件对属于同一行的权值。在基于CRF分类判断部件的标签后,依据边的权值将部件聚合成行,并采用文本/非文本行分类过滤非文本行。与基于局部对比度分割的文本检测方法相比,在候选部件提取方法不变以及实验数据集相同的情况下,检测结果的提升说明了该方法的有效性。  提出了一种基于背景矩形分析的版面分割方法。绝大多数现有方法仅利用前景或是背景提供的信息,该方法则综合考察前景和背景提供的信息以分割版面。在获得文本检测结果后,该方法对文本行(文本区域)和非文本部件(非文本区域)分别进行分析,并综合获得最终版面分割结果。针对文本行,本文首先提取同一文本行内相邻部件间的背景矩形,随后基于启发式规则和分类器过滤版块内背景矩形,最后合并版块间背景矩形获得分隔符,并利用它们将文本区域分成不同的版块。针对非文本部件,本文先后过滤噪声部件和与文本块有重叠的部件。在ICDAR2009复杂文档版面分割竞赛数据集、ICDAR2011历史书籍以及历史报纸版面分割竞赛数据集三个不同类型的数据集上取得的领先性能证明了该方法的有效性。
其他文献
矿井监控系统是保障煤矿安全生产的重要手段,在矿井的防灾、减灾方面以及提高生产效率方面起着重要作用,是矿井生产实现现代化的一个重要标志。煤矿的生产作业很大一部分是在井
近几十年来,电视目标跟踪的应用发展十分迅速,所以进行目标跟踪实时仿真也就显得尤为重要。仿真理论发展已久,仿真技术方兴未艾,本人经过认真比较后选择MATLAB中的SIMULINK作为仿
学位
本课题解决的问题有三个:识别车辆、通信协议设计、车辆信息管理。利用红外通信电子牌照技术,解决了前两个问题,利用现有的数据通信技术和数据库管理技术,解决了车辆出入大量数据
随着嵌入式技术的发展以及应用背景要求的提高,对嵌入式系统的资源分配、调度也有了更高的要求。需要在嵌入式操作系统的设计和实现中充分考虑不同应用对系统中各类有限资源的
本文针对现有测控软件通用性不好的情况,提出了设备运行数据集中管理的方法。在远程监测中,如何实现以往只有在监控现场才能看到的实时画面是远程监测的难点,这用一般的远程访问
学位
ITS(智能交通系统)是解决交通拥堵、交通安全和交通污染等城市交通问题的一种有效方法,能够提高交通运行效率、降低交通事故发生频率。交通视频监控系统作为ITS的重要组成部分,能
遗传算法是模仿自然选择与进化的随机搜索方法。由于其隐含并行性和全局搜索特性,使其具有其他常规优化算法无法拥有的优点。然而,标准遗传算法存在着收敛速度慢、易“早熟”
本文以红外目标模拟器中的分离镜系统为研究对象,将变结构控制算法应用在这一系统中,并在此基础上和传统的控制方法对比,分析滑模变结构控制的优劣。首先,本文阐述了变结构控