基于LVQ的视频文本检测方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:armodmli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频文本的定位、识别与提取作为视频检索技术中重要的组成部分已经成为目前研究人员所研究的热点。由于视频文本与视频内容密切相关,可以利用视频文本对视频建立索引,从而可以更快速的了解视频的内容,定位所感兴趣的视频位置。因此,本文以研究视频文本检测方法为重点,用来准确的检索并定位视频中的文本,最终用于基于内容的视频检索技术。本文在对现有文本检测方法研究的基础上,针对解决视频帧图像低分辨率、复杂背景、多表现形式、视频文本位置与视频文本语种的限制问题,给出一种基于LVQ网络的视频文本检测方法----MLVQ网络。论文主要围绕以下几方面的问题进行了研究:通过研究特征的特性以及提取特征的方法,选取灰度特征、方向特征、中值特征和Kirsch算子作为特征向量。通过对方向特征、中值特征与Kirsch算子进行加权处理,使具有更强的去噪能力与鉴别能力;MLVQ网络中具有最小马氏距离的竞争层神经元为获胜神经元。对MLVQ网络分类后的视频帧像素点即对视频文本初步定位后的区域进行形态学处理,处理后得到的二值图像送入OCR软件,进行字符识别,识别效果较好。实验结果表明,MLVQ网络可以很好的解决非凸区域和凸区域不连接类不能正确分类的问题,且具有较高的分类准确率与较快的网络收敛速度。
其他文献
随着计算机网络技术的发展,为了满足视频点播、网络会议、网络实时游戏等多媒体应用这些当今因特网的主流业务,急需建立一种高效的、有QoS保障的数据通信机制。建立这种机制主
近年来,不确定数据的管理吸引了来自工业界和学术界的极大关注,特别在诸如无线传感器网络、生物技术和生物数据库、基于位置的服务和数据流等新兴的领域中。为了准确获取不确定
数据挖掘是指从分散的异构信息中获取知识的过程,其直接目的是快速检索有用信息,将数据挖掘与Web结合形成的Web信息挖掘是处理海量Web信息的有效手段。虽然Web信息挖掘能极大
时空数据库技术是计算机科学的新兴领域。由于时空数据库本身的一些特性,所以被广泛应用到多种领域。本文重点比较了适用于网络中移动对象轨迹查询的索引结构,提出了一种适用于
当今计算机技术的发展日新月异,软件在我们的生活中扮演着水和电的重要角色。C语言作为一门广泛应用的语言,已有40多年的历史,它在系统软件如操作系统、编译器、数据库等领域
联机事务处理是数据库领域的重要应用。随着近年来电子商务的迅猛发展和企业数据量的激增,用户对数据库事务处理能力提出了越来越高的要求,而处理器技术和内存技术的发展也为
随着网络普及和技术的发展,人们的日常生活中对互联网的依赖性越来越高。普通公众更多地选择通过网上交易实现购物,而政府机构也大力倡导电子政务和电子贸易。当大量用户使用网
最小生成树问题是一类经典的网络优化问题。大量研究表明,最小生成树结构是通信网络设计的最优拓扑。生成树在大多数网络设计和分析问题中扮演着重要角色,然而,实际的网络优化问
在现实世界中,网络随处可见。如全球交通网络、因特网、生物系统中的新陈代谢网络、科学家合作网络、生态网络和在线社区网络等。网络中存在着大量的社区结构,而对网络进行社区
随着网络信息技术的高速发展以及数据挖掘等技术对服务人们社会生活所起到的作用越来越显著,数据共享作为一种数据来源对政府部门、商业机构和研究机构从事各种目的的研究的重