论文部分内容阅读
随着互联网技术与多媒体技术的迅速发展,尤其是WEB2.0和3G技术的推广,每天有数以亿计的视频被上传到互联网上,视频数据呈现快速增长趋势,如何对这些海量的视频内容进行有效管理,已经成为了一个急待解决的关键问题。研究显示,在庞大的视频数据库中,有大量的视频内容是重复的,例如,一段视频由某个网站或者用户首先发布,然后经过多个网站编辑之后重新发布。常见的编辑方式包括亮度调整、视频裁剪、转录、以及叠加LOGO或者字幕等。这样带来两个问题:一方面,这些重复内容是视频监控和版权保护关注的重点;另一方面,对这些内容进行去重也是视频存储和检索所关注的关键问题。而视频拷贝检测技术正是解决这些问题的关键技术。现有视频拷贝检测技术主要分为离线视频内容索引创建和在线视频拷贝检测两个阶段。在第一个阶段,首先对视频库的视频提取关键帧,并基于关键帧提取视频特征,然后对特征数据建立索引以供检索;在第二个阶段,查询视频的特征以相同的方式被提取出来,并基于索引结构进行快速检索,得到特征相似的关键帧,然后经过视频序列匹配,进一步在候选视频中定位出视频拷贝片段。现有的视频拷贝检测技术能够达到一定的准确性,但由于速度上的限制,该技术还不能达到应用的目的。因此,本文主要关注如何平衡视频拷贝检测的准确性和速度,对基于全局特征的视频拷贝检测方法进行了深入研究,主要工作包括:
●提出了一种快速的关键帧提取方法。该方法的特点如下:基于少量的采样帧提取关键帧,与传统基于所有帧的方法相比,该方法只需要对部分视频解压,有利于缩短视频解压时间以加快关键帧提取速度;同时,该方法在减少关键帧数量的同时,也保证了关键帧的代表性,使得关键帧能充分地描述视频内容。
●提出了一种有效的视频序列匹配方法。该方法将两个视频的关键帧相似关系表示为二分图,以视频拷贝片段的关键帧匹配边大部分是平行或近似平行为基础,有效地分割出视频拷贝片段,从而将两个视频的序列匹配问题转化为一对或多对视频片段的序列匹配问题。该方法的特点如下:充分利用了视频拷贝关键帧的匹配规律,结合相似性检索的宽阈值策略,有效地提高了检测准确性,尤其适用于具有少量关键帧的视频序列匹配;一般性较强,不仅适用于两个视频片段的序列匹配,也适用于两个视频或视频片段与整个视频的序列匹配。
最后,我们在两个数据集MUSCLE-VCD-2007和CC_WEB_Video上进行了对比实验,实验结果验证了本文方法在检测准确性和速度上的有效性。