新闻视频结构化及其在移动视频点播中的应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:wuchen2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体和网络技术的发展,网络视频信息已成为日常工作和生活的重要信息来源。如何在大量视频中快速、准确地进行信息检索成为多媒体技术发展中的一个核心问题。基于内容的视频检索(CBVR)被普遍认为是解决这一问题的主要途径,它在视频点播、数字图书馆、交互式电视、多媒体数据库等领域具有重要的应用价值。视频内容的结构化是基于内容的视频检索的基础,而在众多的视频信息中,新闻是一类重要的视频,因此本文的目的是研究新闻视频内容结构化的理论和方法,即从原始的视频流出发,经过镜头边缘检测、主持人镜头识别、广告定位等多个步骤,最终得到一系列独立的新闻故事,以及该新闻故事的关键帧和主题字幕文本。本文的整个结构化过程结合了视频、音频和文本三个方面的信息。文中对镜头边缘检测、主持人镜头识别、广告定位和主题字幕获取四个关键步骤进行了深入讨论,其中的主要创新点为: 第一,提出基于熵的dissolve镜头渐变检测。在镜头边缘检测时,因为在dissolve边缘的前后若干连续帧中,两个镜头的图像是相互重叠且逐渐变化的,所以检测准确率较低。本文提出的基于熵的dissolve检测利用图像的循环移位消除镜头内物体运动的影响,用熵作为检测标准。采用同一个检测标准,不同的检测规则,同时检测镜头切换中常见的各种渐变和骤变,有效地降低了镜头边缘检测的复杂度,提高了检测准确率。 第二,利用音频和视频信息进行广告定位。在新闻视频结构化过程中,商业广告也作为一个独立的故事出现,但是它们往往是我们不关心的。现有的广告检测常利用视频的特殊信息,如黑帧,广告的反复出现等。本文中利用音频和视频两方面的信息减少了对广告具体特征的依赖,对广告的开始和结束位置进行精确定位。
其他文献
学位
关系模式分类是通过分析关系模式的语义,按照应用需求把关系模式划分到一个或多个合适类别或主题的过程。其在数据集成中的数据映射、数据迁移、逻辑模型设计、ETL等工作中起
本文介绍了格基理论的主要原理与它的一些实际应用,然后把格基约化理论应用到运输问题的求解上来.运输问题实际上就是求解满足一定约束条件的线性方程组A·x=b,一般情况下,这是
随着电子商务的迅猛发展,企业级分布式应用程序的开发越来越受关注。SUN的J2EE体系架构是目前市场上主流的企业级分布式应用程序开发平台。使用J2EE架构,能够快速、高效地开发
计算机支持的协同工作(CSCW)是一个新兴的研究领域。随着 Internet 的飞速发展和广泛应用,国内外研究与开发人员对这一门新兴的学科表示出越来越浓厚的兴趣。一批批的科研成
反问题的数值计算是近年来计算数学的研究重点之一,本文对线性不适定反问题的正则化方法进行了研究,统一了常用的几种正则化方法,并针对工程实际应用中两类常见问题——线性不适
本文与以往建立在系统层次上的数字图书馆关联技术不同,此处所讨论的关联技术是建立在资源层次上的,通过使不同资源的元数据之间的关系显式化,将资源联系在一起。主要工作是设计
近年来,网络技术和视频技术迅速发展,传统的监控系统也不断向新的方向发展,出现了结合网络技术和视频技术的远程视频监控系统。在构建基于Web的远程监控系统时,传统的8/16位
本文主要针对SIP通信中的策略的制定和部署等相关问题进行探讨。首先对SIP通信中的各种要素进行了分析,在此基础上,对基于SIP通信系统中策略进行了深入的分析。在面向终端用户
计算机和网络技术的飞速发展,深入影响着社会生活的方方面面。家电信息化、家庭网络化已是信息时代的必然趋势。拥有一个体现高新科技无穷魅力的智能化、现代化的家庭已不再是