论文部分内容阅读
网络时代,人们对信息检索技术越来越关注。视觉信息检索是信息检索技术中一个新的重要研究课题和热点内容。基于内容的视频检索融合了图像理解、模式识别、计算机视觉等技术.它根据描述媒体对象内容的各种特征进行检索,从数据库中查找具有指定特征或含有特定内容的视频片段。
基于内容的视频检索的基本思想是先将视频序列分割为若干镜头,并在每一镜头内选择若干个关键帧,然后提取关键帧的视觉特征作为一种检索机制存入视频数据库,最后根据用户提交的查询内容,按照一定的特征进行视频检索,将检索结果按相似度提交给用户。
本文主要对视频检索技术中三个主要方面:镜头分割、关键帧提取和基于多关键帧检索做了研究分析和相关实验。具体工作和取得成果如下:
1.镜头边界检测研究。研究比较了镜头边界检测的经典算法。提出一种新的比较帧差异的思想,引入一个累积帧记录视频连续帧间的累积差异,放大渐变的特征变化。利用块匹配算法对运动进行估计和补偿,减少物体运动对镜头边界检测的影响,并对阈值进行了分析,用自适应阈值提高镜头边界检测的准确性。
2.关键帧提取研究。研究了基于镜头的方法、基于内容分析的方法、基于 C-均值聚类的方法和基于视觉采样聚类方法提取视频的关键帧。介绍了各种算法的思想,做了相关算法实验,分析实验结果并总结每种算法的特点。
3.视频检索研究。用镜头关键帧之间的相似度表示视频镜头间的相似程度。主要研究了基于多关键帧的相似镜头检索的三种算法:利用关键帧间平均距离的算法、利用最近特征线的算法和利用组合相似性的算法。对各种算法都做了具体的描述,做了算法实验并分析实验结果。