基于多特征融合的视频检索技术研究

来源 :东北林业大学 | 被引量 : 1次 | 上传用户：www478478

【摘要】

：

随着网络技术和多媒体技术的快速发展,多媒体已经成为人们日常获取信息最重要的手段之一,而这其中,视频由于集视觉与听觉一体的特性而大受人们喜爱。随着互联网视频数据的急

【作者】

：

张昊骕

【出处】

：

东北林业大学

【发表日期】

：

2020年01期

【关键词】

：

视频检索多特征融合镜头分割关键帧提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络技术和多媒体技术的快速发展,多媒体已经成为人们日常获取信息最重要的手段之一,而这其中,视频由于集视觉与听觉一体的特性而大受人们喜爱。随着互联网视频数据的急剧增长,如何在海量视频数据中快速准确地找到自己想要的信息已经成为人们目前面临的一个巨大挑战,传统的通过人工手动对视频进行标注的查询方法面对日益增长的视频数量已经力不从心,基于多特征的视频检索技术成为目前的研究热点。基于多特征的视频检索的主要步骤分为:镜头边界检测、镜头关键帧提取、视频检索等技术。本文主要对镜头边界检测、镜头关键帧、视频检索技术三个方面进行研究。目前,在镜头边界检测方面,现有算法主要有以下几个缺点:提取单一特征,不能充分表达视频内容。对于渐变镜头的检测准确率不高,而且不能在高效性和准确性之间取得平衡。在关键帧提取方面,现有算法以聚类算法为主,然而聚类算法存在着需要人工设定初始聚类中心、需要人工设定聚类数量的缺点。在视频检索方面,现有算法在特征提取的方式、视频相似性度量方面的准确性仍需提高。针对镜头边界提取、镜头关键帧提取、视频检索技术存在的不足,本文进行了以下工作:(1)在镜头边界提取方面,提出一种基于SURF和SIFT特征的镜头分割算法。算法分为初检和复检两个步骤。在初检中,首先提取帧图像的HSV颜色直方图。进行临近帧的切变帧判断。然后提取SURF特征并融合颜色特征,对邻近帧进行切变帧复判,根据切变帧的过渡时间与渐变帧不同的特点,通过使用双阈值结合改进的可变滑动窗口结合的方式得到镜头边界候选帧,最后,将得到的候选帧集合利用SIFT特征结合双阈值与滑动窗口技术进行复检,最后得到最终的镜头变换帧。实验数据表明,本算法能够有效地识别并区分切变镜头和渐变镜头,其准确性高于文献算法。(2)提出了一种基于改进K-Means聚类算法的关键帧提取算法,基于细胞吞噬作用的思想。利用图像熵作为聚类的依据,将每一个关键帧自底向上地,不断地对关键帧所在类进行合并操作,合并的条件基于近邻的思想,最后在得到的类中,利用镜头边界法按固定频率采集帧作为关键帧。实验数据表明,该方法解决了 K-Means缺点,不需要人工设定初始聚类中心、聚类数量,并且提取出的关键帧具有较强的代表性,其准确性高于文献算法。(3)在研究了上述镜头分割与关键帧提取算法的基础上,提出了一种基于SURF和改进的颜色特征的视频检索算法,首先对待匹配图像分块并提取图像的颜色特征和SURF特征将其融合,利用滑动窗口技术对待检图像进行匹配,遍历关键帧序列得到的匹配距离最小的窗口的距离作为待检图像与视频的实际距离,最后遍历视频库找到距离最小的视频,实验表明该方法通过多个特征融合以及滑动窗口的配合,使得本文算法平均准确率为96%,高于文献的算法,具有较高的准确性。综上所述,实验结果证明本文所提出的算法可以准确高效地提取视频文件的镜头边界、和镜头关键帧并在此基础之上实现精确的视频检索。

其他文献

融合舌象标注的中医问诊系统的设计与实现

随着信息化时代的来临,计算机技术在越来越多的领域取得丰富的成果,如今基于计算机技术的智能医疗的相关研究引起人们广泛的关注。计算机技术,尤其是人工智能技术在医疗领域

学位

中医问诊系统舌象标注辅助诊断

基于BB84协议的量子数字签名方案研究

数字签名被认为是现代密码学最重要的发明之一,主要用于保证通信中信息的完整性和发送方的身份认证。然而,经典的签名协议的安全性依赖于一些复杂的数学计算,如寻找离散对数

学位

量子数字签名添加单光子的相干态光源单诱骗态签名率

连续点式锻造激光快速成形TA15合金的力学各向异性研究

名义成分为Ti-6.5Al-2Zr-1Mo-1V的钛合金,中国牌号为TA15,是前苏联于1964年成功开发出的一种钛合金,与其相对应的俄罗斯牌号为BT20,是一种中等强度的近α型钛合金。由于TA15钛合金具有中等的室温和高温强度,良好的热稳定性和焊接性,因此在航空航天领域被作为制造结构承力零件的主体材料而广泛的应用。激光快速成形技术(Laser Rapid Forming,LRF)制造的零件,由于

学位

连续点式锻造激光快速成形TA15钛合金显微组织热处理力学性能各向异性

刑事判决书中的说理研究

伴随着全面依法治国的快速推进,社会大众的法治意识逐渐提高,这对我国现阶段的司法工作也提出了新的要求。自从裁判文书公开上网的政策开始实行,裁判文书的说理日益成为大家

学位

刑事判决书说理法治改革

光学元件激光诱导损伤在线检测系统研究

光学元件的激光损伤是限制高功率激光器激光能量输出的关键因素之一。对于高功率激光器的建造,光学元件激光诱导损伤的在线检测显得极为重要。目前,元件表面损伤还主要依靠目

学位

激光损伤表面散射暗场成像损伤判断损伤提取

面向高中地理教师GIS技能提升的教程设计与实施方法研究

地理信息科学已经发展为地理学的分支学科之一,地理信息产业化的势头强劲,至2016年10月,中国手机地图(百度地图、腾讯地图、高德地图等)用户总量达到6.5亿人,已经成为人们生

学位

地理信息技术中学地理教学GIS技能

卫星通信系统联合路由选择及资源分配算法研究

卫星通信系统通过部署具有信息收发功能的人造卫星可为地面用户提供信息交互服务。因覆盖广、容量大、性能稳健等优点,卫星通信系统近年来备受关注。为满足用户应用需求,提升

学位

卫星通信系统资源分配路由选择能效能耗

HGB/PES复合粉末激光烧结数值模拟与实验研究

选择性激光烧结技术(Selective Laser Sintering,SLS)是众多3D打印技术中较为成熟的一种,与传统加工方式相比,该技术不仅可以根据人为的需求,快速加工出几何形状复杂、性能良

学位

激光烧结空心玻璃微珠/聚醚砜树脂复合材料数值模拟力学性能

基于模态降阶技术的非线性响应计算方法研究

高超声速飞行器为降低结构质量和提高飞行效率,使用了许多薄壁结构。这些结构在飞行过程中经历如噪声载荷、和温度载荷等耦合作用,处于复杂的力学状态,将产生由几何大变形造成的非线性响应,导致结构疲劳寿命大幅降低。在飞行器设计过程中,由于直接威胁到飞行器安全,需要计算结构的非线性响应。在实际工程应用中,传统的非线性响应计算方法需要大量计算资源和存在局限性。本文探讨了模态降阶技术在预测热噪声复合环境下结构非线

学位

模态降阶技术几何非线性热噪声载荷声振耦合

光子晶体光纤中矢量光场特性及应用的数值研究

光子晶体光纤（Photonic crystal fiber,PCF）具有周期性结构和无截止单模特性,通过改变光纤的结构参数即可实现模场尺寸可调、色散可控等特性,被广泛应用于光场调控以及非线性光

学位

矢量光场有效折射率限制损耗色散超连续谱光子晶体光纤

基于多特征融合的视频检索技术研究

其他学术论文