可视媒体中文本的检测、分类与识别研究

来源 :南京大学 | 被引量 : 0次 | 上传用户：zhangnnnnnn

【摘要】

：

图像和视频中的文本检测与识别是模式识别与计算机视觉研究的前沿热点和难点之一，现有文本检测与识别研究主要针对扫描文档或者分辨率较高理想情况下获取的视觉媒体。近年来，研

【作者】

：

许佳敏

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2015年期

【关键词】

：

可视媒体文本检测分类算法特征识别

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

图像和视频中的文本检测与识别是模式识别与计算机视觉研究的前沿热点和难点之一，现有文本检测与识别研究主要针对扫描文档或者分辨率较高理想情况下获取的视觉媒体。近年来，研究者逐步将关注点集中到各类自然场景环境中快速、准确的文本检测与识别。　　本文对可视媒体中的文本检测、分类与识别问题进行了系统和深入的研究。考虑到视觉媒体中文本信息的多样性，在文本检测部分，本文首先提出了基于边缘对称性的自然场景图像中的文本检测算法，该算法利用文本边缘笔画内和笔画间对称性的提取文本候选区域，然后配合基于笔画间距离的文本块聚合技术将候选区域聚类，最后利用强约束进行文本和非文本块的验证。针对另一类常见的网页图像中的文本检测问题，本文使用基于RGB通道的颜色聚类算法，结合针对字符区域的纹理与空间对称性分析进行文本检测。在公用数据集（如ICDAR2013数据集等）进行的测试和对比实验表明，本文所给出的方法可以较好地检测出相应图像中的文本信息。　　由于所检测的文本既可能是人工叠加的图形文本(Graphics text)、也可能是图像中包含的自然场景文本(Scene text)，同时文本可能会以2D或3D方式存在，给文本自动识别带来了困难。本文进一步研究了文本的自动分类方法，从文本块特征值的分布信息和文本骨架在不同边缘提取算法上的完整性角度对人工文本和场景文本进行了分类、从边缘像素的笔画内和笔画间的单向双向对称性角度对2D和3D文本进行了分类。本文通过分类前和分类后的自然场景文本识别准确率的对比实验，验证了上述文本分类工作的必要性。　　最后，本文还探索了视频流中的动态文本区域的提取和文本跟踪方法，并开展了相关实验和分析。

其他文献

适合中小型企业的VPN设计与实现

随着Internet在企业领域应用的不断深化,VPN(虚拟专用网,Virtual Private Network)作为一种廉价安全的组网方案越来越受到中小企业的关注。这些企业有其自身的特点,并不能完

学位

VPNIPSecNDIS中间层驱动程序Windows操作系统内核

静态和动态相结合的软件安全保护方法研究

随着规模的扩大和复杂度的提高，软件变得越来越难以控制。采用容错、复用等技术并不能从根本上消除软件中的缺陷。软件安全已成为信息技术研究的热点之一。研究软件安全保护方

学位

软件安全缺陷容错软件复用静态分析动态检测软件安全保护

基于遗传算法的高校排课系统算法改进的研究

遗传算法自上世纪诞生以来，迅速运用到复杂科学计算、工程计算、资源调度、业务优化、时间表等复杂问题的求解上。这些传统难题的症结在于构建的数学模型非常复杂，需要用到积分

学位

高校排课办公自动化程序设计遗传算法

基于多示例多标记学习的手机游戏道具推荐

手机游戏作为一个新兴产业,通过将高新技术转化为现实生产力,在我国产业结构升级进程中扮演了重要角色。虚拟道具销售是手机游戏收益的主要来源。考虑到手机游戏用户大多为业

学位

机器学习多示例多标记学习半监督学习游戏推荐

面向领域本体进化的术语提取及术语层次关系发现

领域本体的建造与进化是近年来的热点问题之一。从哲学和逻辑学的角度看，本体的实现是自莱布尼茨以来许多科学家的梦想，它基于这样一种思想：如果我们能建立一个符号系统，系统中的

学位

术语自动提取术语层次关系提取领域本体进化ADTree概念格人工智能

通用处理器硬件调试系统研究

随着集成电路制造工艺的进步,处理器设计水平的提高,处理器的复杂度呈指数幅度上升,而对故障的查找和修复却变得越来越困难.传统处理器的调试采用监测并控制其地址与数据总线

学位

硬件调试复杂指令集精简指令集处理器

基于CBR技术的网络入侵检测系统研究与设计

随着网络技术快速发展和网络应用环境不断普及，安全问题也越来越突出，引起各界关注。传统的加密和防火墙技术已不能完全满足安全需求，入侵检测技术作为一种新的安全手段，正越来越

学位

入侵检测入侵检测网络安全网络安全人工智能人工智能

CPK认证在航空货运系统中的应用研究

随着Internet以及电子商务的发展，人们对信息安全的需要越来越迫切。为了保证互联网上信息传输的机密性、真实性、完整性和不可否认性，防范电子交易及支付过程中的欺诈行为，必须

学位

组合公钥

基于地理位置信息的节能路由算法研究

无线传感器网络(WSN:Wireless SensorNetworks)在环境检测、空间探索等众多领域中有着非常广泛的应用。路由协议是WSN组网和性能优化的关键组成部分。近年来，设计和评价高效无

学位

地理位置

基于Pert框架的软件项目人力资源调度研究与工具实现

软件产品的质量取决于软件开发维护的过程，CMMI模型以大量的关键过程域作为评审软件企业能力成熟度的标准，“项目策划”是其中一基础关键过程域，关系软件企业每次成熟度评定，其特

学位

人力资源调度软件开发软件企业Pert框架

可视媒体中文本的检测、分类与识别研究

其他学术论文