论文部分内容阅读
随着计算机技术和网络技术的不断发展,互联网数据已呈现出规模海量化、表现形式多样化的趋势。运动视频作为一种重要的互联网数据类型,因其庞大的数据量,给信息的传输、存储以及管理造成了很大的困难。传统的文本数据处理方法既需要消耗大量的人力,也无法充分利用视频中包含的丰富信息。为此,人们提出了多种基于内容的视频语义分析技术,这些技术已在视频检索、索引、查询中发挥关键作用。近年来,国内外学者在提取视频语义方面提出了许多较为实用和有效的算法。但是这些算法依然普遍存在较多问题,例如,算法设计过于复杂、计算量大;对特殊领域的特点和规则的依赖导致其应用受到局限;以及视频数据的多模态特性利用不充分等。因此,本文围绕上述问题开展了以有效提取视频语义为目的的研究,主要工作包括:1)提出了一种通用的、基于局部特征融合的视频语义分析方案。首先利用对噪声比较敏感的峰值运算来抑制噪声干扰,并辅助以形态学处理,提取包含所有运动像素的局部区域以及运动特征。然后,分别利用颜色直方图和灰度共生矩阵提取该局部区域内的颜色和纹理特征,并在实现这些局部特征的加权串联融合后,利用隐马尔科夫模型(Hidden Markov Models, HMM)完成视频内容的语义识别。仿真实验结果表明,该方案能够有效降低噪声干扰,充分利用视频数据的多模态特性,具有较好的分析准确性。2)提出了一种基于多特征和多模型的体育视频语义分析方案。首先,依据体育竞技场地相对固定、有规律的特点,提取视频镜头首帧图像的语义颜色特征,并结合支持向量机(Support Vector Machine, SVM)进行场景分类。这在细化了语义识别类型的同时,也降低了训练和检测的难度。然后,考虑到体育视频中的摄像机运动较为简单,在提取运动对象前后,分别进行图像配准和差分相乘处理,以实现运动特征较为准确的提取。最后,在对应场景的语义范围内利用HMM对镜头进行更细致的分类。仿真实验结果表明,该方案不仅能充分利用各类特征的属性,还能结合体育视频的特点,高效、多层次地实现了体育视频的语义识别。