可视媒体中文本的检测、分类与识别研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:zhangnnnnnn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像和视频中的文本检测与识别是模式识别与计算机视觉研究的前沿热点和难点之一,现有文本检测与识别研究主要针对扫描文档或者分辨率较高理想情况下获取的视觉媒体。近年来,研究者逐步将关注点集中到各类自然场景环境中快速、准确的文本检测与识别。  本文对可视媒体中的文本检测、分类与识别问题进行了系统和深入的研究。考虑到视觉媒体中文本信息的多样性,在文本检测部分,本文首先提出了基于边缘对称性的自然场景图像中的文本检测算法,该算法利用文本边缘笔画内和笔画间对称性的提取文本候选区域,然后配合基于笔画间距离的文本块聚合技术将候选区域聚类,最后利用强约束进行文本和非文本块的验证。针对另一类常见的网页图像中的文本检测问题,本文使用基于RGB通道的颜色聚类算法,结合针对字符区域的纹理与空间对称性分析进行文本检测。在公用数据集(如ICDAR2013数据集等)进行的测试和对比实验表明,本文所给出的方法可以较好地检测出相应图像中的文本信息。  由于所检测的文本既可能是人工叠加的图形文本(Graphics text)、也可能是图像中包含的自然场景文本(Scene text),同时文本可能会以2D或3D方式存在,给文本自动识别带来了困难。本文进一步研究了文本的自动分类方法,从文本块特征值的分布信息和文本骨架在不同边缘提取算法上的完整性角度对人工文本和场景文本进行了分类、从边缘像素的笔画内和笔画间的单向双向对称性角度对2D和3D文本进行了分类。本文通过分类前和分类后的自然场景文本识别准确率的对比实验,验证了上述文本分类工作的必要性。  最后,本文还探索了视频流中的动态文本区域的提取和文本跟踪方法,并开展了相关实验和分析。
其他文献
随着Internet在企业领域应用的不断深化,VPN(虚拟专用网,Virtual Private Network)作为一种廉价安全的组网方案越来越受到中小企业的关注。这些企业有其自身的特点,并不能完
随着规模的扩大和复杂度的提高,软件变得越来越难以控制。采用容错、复用等技术并不能从根本上消除软件中的缺陷。软件安全已成为信息技术研究的热点之一。研究软件安全保护方
遗传算法自上世纪诞生以来,迅速运用到复杂科学计算、工程计算、资源调度、业务优化、时间表等复杂问题的求解上。这些传统难题的症结在于构建的数学模型非常复杂,需要用到积分
手机游戏作为一个新兴产业,通过将高新技术转化为现实生产力,在我国产业结构升级进程中扮演了重要角色。虚拟道具销售是手机游戏收益的主要来源。考虑到手机游戏用户大多为业
领域本体的建造与进化是近年来的热点问题之一。从哲学和逻辑学的角度看,本体的实现是自莱布尼茨以来许多科学家的梦想,它基于这样一种思想:如果我们能建立一个符号系统,系统中的
随着集成电路制造工艺的进步,处理器设计水平的提高,处理器的复杂度呈指数幅度上升,而对故障的查找和修复却变得越来越困难.传统处理器的调试采用监测并控制其地址与数据总线
随着网络技术快速发展和网络应用环境不断普及,安全问题也越来越突出,引起各界关注。传统的加密和防火墙技术已不能完全满足安全需求,入侵检测技术作为一种新的安全手段,正越来越
随着Internet以及电子商务的发展,人们对信息安全的需要越来越迫切。为了保证互联网上信息传输的机密性、真实性、完整性和不可否认性,防范电子交易及支付过程中的欺诈行为,必须
学位
无线传感器网络(WSN:Wireless SensorNetworks)在环境检测、空间探索等众多领域中有着非常广泛的应用。路由协议是WSN组网和性能优化的关键组成部分。近年来,设计和评价高效无
学位
软件产品的质量取决于软件开发维护的过程,CMMI模型以大量的关键过程域作为评审软件企业能力成熟度的标准,“项目策划”是其中一基础关键过程域,关系软件企业每次成熟度评定,其特