面向编目的新闻视频主持人和标题字幕检测方法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:gg499586617
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于内容的视频检索已经成为数字媒体领域关注的热点研究方向。新闻视频作为一种特殊的视频种类,是人们获取信息的渠道。由于视频数量每天以指数级的趋势增长,数量庞大,因此需要提取新闻视频的结构化特征进行编目整理,便于快速地定位和检索所需的新闻内容。根据新闻视频具有自身的独特结构,本文依据主持人镜头和标题字幕两个特征对新闻视频进行编目处理。   为了对新闻视频的层次进行语义分析,首先本文提出了一种基于稳定性模型的主持人镜头检测算法,对分割后的镜头进行检测,区别主持人镜头和非主持人镜头;然后本文结合经典的字幕检测算法,采用了基于时空域信息的标题字幕检测、验证、提取和跟踪算法,提取出新闻的标题字幕,送往OCR中进行识别,将识别的文字结果结合一些视频信息的编目属性以列表的形式存储到相应文件中。本文提出的算法实现了对新闻视频片断层、场景层和镜头层的特征分析,并提取相应的特征用于新闻视频的编目,实验证明提取的特征能够很好地描述新闻视频的语义信息,为依据内容的新闻视频检索提供了很好的依据。
其他文献
近来,几起重大煤矿安全事故的发生再次引起了人们对于煤矿安全问题的广泛关注,煤矿安全问题始终是安全生产工作的重中之重。随着信息技术的高速发展,以普适计算、物联网为代表的
OCTEON CN5200是Cavium Networks公司近些年推出的某系列多核SPU(业务处理板)的芯片处理器,该处理器具有强大的网络数据处理能力,在其给出的解决方案中,用户是通过客户端的串口
现阶段移动增值业务仍然是移动通信市场的主要业务支柱,近年来,随着通信技术的发展,移动网络承载能力的加强,移动终端功能性能的提高,使各大运营商增值业务竞争的焦点转移到
人脸检测和识别技术是极富挑战性的热门研究方向,是计算机视觉领域的一项关键应用技术,在经济、安全、社会保障、军事等方面具有巨大的潜在价值。目前在人脸方面的研究主要包
随着移动互联网和智能终端技术的发展,智能手机正迅速取代功能性手机,成为我们日常生活中必不可少的工具。在智能手机市场高速增长的同时,操作系统平台的竞争也日趋白热化,iOS和A
以往,人们习惯使用同步的“请求-应答”的通信方式来满足各种软件应用的需求,但在网络规模日益扩大,参与实体逐渐增长的今天,这种传统的方式严重制约了分布式系统的发展。近年来,
随着移动通信技术的不断发展,无线接入网的结构变得越来越复杂,用户对无线接入网服务质量要求也越来越高。这要求无线接入网能够动态地适应网络结构变化与用户多变的需求。3GPP
随着网络规模的扩大与运营商服务与业务的多样化,作为骨干网、城域网重要节点的路由器的规模扩展性、资源重用性、运行可靠性问题逐渐成一项挑战,传统的路由器的主控、业务与转
随着现代电子信息技术的飞速发展,移动终端种类越来越丰富,移动通信方式越来越多,速度越来越快,越来越多的人通过移动终端访问网页或其他联网应用。在这样的大背景下,移动广
当前,伴随着移动通信技术的不断发展,移动增值业务也越来越受运营商和SP(Service Provider,业务提供商)青睐。为了适应这种变化,达到在尽量缩短开发周期,降低开发的复杂度的