论文部分内容阅读
随着多媒体和网络技术的迅速发展,多媒体信息与日俱增,然而如何有效地对这些视频数据进行组织、表达、存储和管理,以及如何对其进行快速检索与浏览已成为视频领域中急需解决的重大课题。由于视频数据自身内容的丰富性和多样性、结构的复杂性,传统的数据管理与检索方案不能很好地从巨大的视频数据源中找到所需要的信息,于是基于内容的视频检索便应运而生。 基于内容的视频检索根据视频的内容及上下文关系,在视频分析的基础上,提取能够反映视频内容的各种特征,进而通过模式匹配从海量视频数据库中检索出相关的视频流。本文围绕该领域中的几个关键技术展开研究。 首先,对提取关键帧这一关键技术做了深入探讨。研究了提取关键帧的原则及特点,并简要分析了该领域存在的主要算法,然后针对其局限性,提出两种新的关键帧提取算法。 针对聚类算法中聚类中心不易得到以及一些聚类算法计算量大的不足,提出一种基于互信息关键帧提取算法。该算法利用互信息作为视频帧之间的差异性度量,以此把视频镜头分成多个相似性高的小镜头;然后利用图像熵的概念,提取小镜头中图像熵最大值的一帧作为关键帧,这样实现自适应的提取关键帧,而且计算量小。通过对几种不同类型的视频片段进行试验,实验结果证明利用本文中提出的算法提取的关键帧可以根据视频的内容自适应的提取关键帧,有效的代表视频内容,且计算量小。 以往的关键帧提取基本上都是先分割镜头,然后从镜头中提取关键帧,镜头分割的好坏直接影响最后关键帧的提取结果。本文中提出的基于视觉注意的关键帧提取算法,在不分割镜头的前提下提取视频关键帧。对视频帧计算它的静态显著度和运动显著度,合成一个视觉注意度特征值。通过计算所有视频帧的视觉注意度特征,合成一个视觉注意度曲线,在曲线的极大值处提取关键帧。此算法实现自适应提取关键帧,并且提取的关键帧符合人眼的视觉要求。实验结果证明该算法可以自适应提取关键帧,效果明显,并且符合人眼的视觉特性。 最后,根据检索系统的设计要求,设计了一个基于关键帧的视频检索系统框架。该系统中使用了本文中提出的两种关键帧提取算法,实现了基于关键帧的视频检索过程。该系统对视频进行结构化处理,提取特征,进行相似性匹配,最终返回相似视频段。