基于关键帧的视频内容检索技术的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:mijun123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体和网络技术的迅速发展,多媒体信息与日俱增,然而如何有效地对这些视频数据进行组织、表达、存储和管理,以及如何对其进行快速检索与浏览已成为视频领域中急需解决的重大课题。由于视频数据自身内容的丰富性和多样性、结构的复杂性,传统的数据管理与检索方案不能很好地从巨大的视频数据源中找到所需要的信息,于是基于内容的视频检索便应运而生。  基于内容的视频检索根据视频的内容及上下文关系,在视频分析的基础上,提取能够反映视频内容的各种特征,进而通过模式匹配从海量视频数据库中检索出相关的视频流。本文围绕该领域中的几个关键技术展开研究。  首先,对提取关键帧这一关键技术做了深入探讨。研究了提取关键帧的原则及特点,并简要分析了该领域存在的主要算法,然后针对其局限性,提出两种新的关键帧提取算法。  针对聚类算法中聚类中心不易得到以及一些聚类算法计算量大的不足,提出一种基于互信息关键帧提取算法。该算法利用互信息作为视频帧之间的差异性度量,以此把视频镜头分成多个相似性高的小镜头;然后利用图像熵的概念,提取小镜头中图像熵最大值的一帧作为关键帧,这样实现自适应的提取关键帧,而且计算量小。通过对几种不同类型的视频片段进行试验,实验结果证明利用本文中提出的算法提取的关键帧可以根据视频的内容自适应的提取关键帧,有效的代表视频内容,且计算量小。  以往的关键帧提取基本上都是先分割镜头,然后从镜头中提取关键帧,镜头分割的好坏直接影响最后关键帧的提取结果。本文中提出的基于视觉注意的关键帧提取算法,在不分割镜头的前提下提取视频关键帧。对视频帧计算它的静态显著度和运动显著度,合成一个视觉注意度特征值。通过计算所有视频帧的视觉注意度特征,合成一个视觉注意度曲线,在曲线的极大值处提取关键帧。此算法实现自适应提取关键帧,并且提取的关键帧符合人眼的视觉要求。实验结果证明该算法可以自适应提取关键帧,效果明显,并且符合人眼的视觉特性。  最后,根据检索系统的设计要求,设计了一个基于关键帧的视频检索系统框架。该系统中使用了本文中提出的两种关键帧提取算法,实现了基于关键帧的视频检索过程。该系统对视频进行结构化处理,提取特征,进行相似性匹配,最终返回相似视频段。
其他文献
手语是聋人的第一语言这一观点,已经为人们所接受,然而当今社会中信息传播的主要方式是建立在有声语言之上的,给聋人接受信息造成极大困难。手语合成研究的主要目的就是通过提供
当前我国制造业正在向“绿色制造”、“柔性制造”发展转型,产业对伺服压力机的研究和应用越来越广泛。新型的伺服压力机相对传统压力机具有高精度、高柔性、低能耗、低噪声
随着在线社交网络的快速发展,爆炸性增长的信息在社交网络用户中创建和传播。作为在线社交网络的代表,微博是一个基于用户关系的信息分享、传播以及获取平台。在微博中,用户可以
可信计算是一种信息安全的新技术,它主要从硬件、固件、操作系统和应用等方面综合采取措施,将大多数不安全因素控制在终端源头。可信计算已经成为信息安全领域的热点研究问题,因
随着个人信息的增多,用户最大的交互负担,来自于用户在多种设备或者同一设备的不同任务之间切换时,需要去重新寻找当前任务所涉及的资源。而建立任务模型的目的就是为了更好
随着软件技术和互联网技术的发展,问卷调查正从传统的纸质调查、手工处理的方式向在线问卷调查和计算机自动分析统计的方式转变。利用计算机强大的计算能力和快捷方便的网页浏
LTE是一种先进的宽带无线移动通信网标准,采用OFDM技术使系统能够达到更高的性能。LTE的目标是支持更高的峰值速率,满足业务多样性需求,提高系统容量,有效提升小区边缘用户性
在互联网技术飞速发展的今天,搜索引擎已经成为人们生活中必不可少的一部分。各式搜索引擎已经成为在信息过载的互联网中搜寻信息的有利工具。但是,搜索引擎的表现并不总是尽如
近年来,随着对经典集合的研究及应用的不断深入,经典集合的弊病也日益暴露,如信息丢失、边界过于明显等。因而需要寻找一个新的方法来处理数据中的模糊性,改进经典集合的缺点
多目标优化问题(Multi-ObjectiveProblems),在理论科学研究和实际工程应用中常常遇到的一类问题。它一般包含多个相互冲突的子目标,要找到满足所有目标约束的最优解(集),通常将问题