基于时域子空间聚类的视频摘要算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:docsecurity02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动电话和其他定向相机设备的爆炸性增长,人们捕获和存储了越来越多的视频数据。由于大数据带来的信息冗余度高的可能性,人们希望能更加全面且智能的利用这些数据信息中信息量大的部分以及人们感兴趣的部分。由于多媒体时代视频的娱乐性以及微视频的流行发展,一种迫切的需求应运而生,即我们需要一种方法可以快速地浏览并理解视频中的内容。自动生成视频摘要是解决这些问题的有效技术之一,它能够提取简洁的摘要来代表原始的长视频,截取有效片段作为算法输出。这其中涉及两个问题:视频分割和摘要生成。以前的大多数工作都只是通过利用像边界检测这样的简单策略来来解决视频分割的问题。然而,这种方法产生的结果并不理想,因为它们不仅缺乏视频分割阶段的学习机制,而且还将整个任务分成两个独立的阶段。考虑到视频具有时间连续性,为了得到视频的有效片段,在视频处理的各个阶段我们不能忽略时间这一重要信息。经典的视频摘要算法已经逐步从非监督转向监督的机器学习上来,充分利用人类的自我认知来指导视频算法研究。在本文中,我们提出了一种新颖的视频摘要方法:基于结构传递驱动的时域子空间聚类分割(Summary Transfer Subspace Clusctering,STSC)。这是一种利用先验知识进行有监督的机器学习的视频摘要算法。首先从源视频中学习视频的结构信息,然后将得到的视频的结构矩阵传输到目标视频中,再利用结构矩阵做时域子空间聚类将视频进行时域上的分割,最后通过行列式点过程(Determinantal Point Process,DPP)算法,从分割出的片段中选择一个包含主要信息的镜头子集作为输出来创建最终的视频摘要。我们将本文提出的算法与已有的经典算法进行比较,在SumMe和TVSum数据集的实验结果验证了所提算法的有效性。
其他文献
随着三维渲染和可视化技术的快速发展,三维模型被广泛地应用在计算机辅助设计、娱乐游戏及机械设计等领域。互联网上普遍存在数以亿计三维模型,如何精确、高效和快速地从大规
随着因特网、通信技术、智能手机行业等的飞速发展,视频的获取和传输变得极为便利。同时视频本身具有信息量丰富、观看舒适等优势,种种因素使得视频取代传统媒介成为最流行的
烷烃是VOCs中化学性质最稳定、最难催化燃烧的一类有机物,选择丙烷作为研究VOCs催化性能的代表性反应物,具有很好的研究价值。本文阐述了用于VOCs催化燃烧的催化剂,重点分析
筒仓设计时,动态压力作为一个重要设计因素。在中国规范中,浅圆仓设计时往往不考虑其动态压力的影响。但随着其高度不断增加,尤其是高径比大于1.0的大直径浅圆仓,卸料时会产
双足被动机器人行走问题的传统研究方法通常基于完全刚体模型,采用完全非弹性碰撞假设建立系统动力学方程。然而它忽略了局部接触区和整体结构的柔性。这会导致柔性双足机器
近年来,不少城市为改善城市景观及优化人居环境,在人口相对密集区域修建了城市水利景观设施,如无坎宽顶堰。城市水利景观设施给人们带来视觉享受的同时也产生了较大的水噪声,
航空发动机是一种在复杂载荷工况下工作的复杂机械装备。随着其性能的不断提高,对于航空发动机结构振动特性预测准确度的要求也逐渐提高。并且,由于发动机各个部件的结构复杂
随着高速动车组技术的快速发展,人们对高速动车组列车运行的舒适度要求越来越高,车辆运行时产生的振动对乘客舒适性与旅途安全性造成了极大的影响,其中,列车横向振动是影响旅
淡水资源短缺是二十一世纪最严重的全球性问题之一。太阳能热局域蒸发技术由于其高效的光热转换效率和优良的蒸发性能,在解决淡水资源短缺问题上具有巨大的潜力。本论文从热
挥发性有机化合物(Volatile Organic Compounds,VOCs)是一类有机化合物的统称,它作为一种重要的大气污染物,对人类活动和自然环境的危害严重,因此逐渐受到越来越多的重视。目