一种联合字幕语义及图像SIFT特征的视频场景分割与标注方法

来源 :中国科学院声学研究所第四届青年学术交流会 | 被引量 : 0次 | 上传用户：mnm159753

【摘要】

：

目前，对视频进行场景分割的通用方法一般仅依赖于视频的视觉特征，导致其分割速度慢准确率不高。试图针对电影类视频给出一种更实用的场景分割方法，为此在视觉图像特征之外该文还利用了电影中的对白(字幕)信息。发现某条字幕呈现时间段内的视频帧一般不出现场景切换点。基于这一事实，切分出每条字幕持续时间段内视频帧作为进行场景聚簇的最小单元。然后，综合利用了最小单元对白文本的主题以及最小单元所包含的视频图像帧的相似

【作者】

：

刘鹏李松斌戴琼兴

【机构】

：

中国科学院声学研究所南海研究站

【出处】

：

中国科学院声学研究所第四届青年学术交流会

【发表日期】

：

2012年11期

【关键词】

：

视频图像场景分割字幕语义 SIFT特征自动标注

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

KINETICS MONITORING OF COPPER (II)-CATALYZED HYDROGEN PEROXIDE-THIOSULFATE SYSTEM WITH ZONE-PASSING

In the present work the catalytic effect of copper (II) on the hydrogen peroxide-thiosulfate reaction was evaluated with capillary electrophoresis by in-capillary reaction methodology and kinetics of

会议

Capillary electrophoresisZone-passingThiosulfateHydrogen peroxideKinetics

DETERMINATION OF ORGANOPHOSPHATE PESTICIDES IN VEGETABLES BY INTEGRATING MICROEXTRACTION WITH MICROF

会议

RAPID IDENTIFICATION OF PATHOGENS FOR MEDICAL DIAGNOSIS BY CAPILLARY ELECTROPHORESIS AND MALDI-TOF M

会议

ENANTIOSEPARATIONS OF CHIRAL AMINO ACIDS BY HOME-MADE CAPILLARY ARRAY ELECTROPHORESIS WITH 532 NM LI

会议

二维点阵的复合选频叉指换能器的研究

提出一种具有二维点阵结构叉指换能器，即在1280YX铌酸锂压电基片上制作叉指换能器，然后再在叉指换能器上制作一层二维钨点阵。采用时域有限差分法计算二维点阵的带隙分布，其中，布洛赫定理和完全匹配层吸收法用来处理边界反射，二维点阵结构叉指换能器频率特性由叉指换能器频率响应和二维金属点阵频率响应叠加复合而成，该频率合成是通过调节叉指电极和二维金属点阵之间的周期比例实现，得到具有选频通带或选频阻带叉指换能

会议

叉指换能器二维点阵结构时域有限差分法声表面波

基于相位解调的主动超声空化检测

空化是液体特有的一种动力学现象，水利机械的运转都不可避免地遇到空化问题。本文提出一种基于相位解调的流体空化超声检测方法，分析了流体运动对其中传播的超声波束的调制原理，确定了超声相位的变化与流场空间平均速度脉动之间的对应关系，实现了通过解调信号辨识空化状态。

会议

空化检测超声波束相位解调流体运动

基于UVM的事务级处理器建模

随着集成电路设计复杂度的提高，事务级建模已经成为处理器设计领域的一个新的研究热点。本文以SuperV处理器作为研究原型，介绍了一种基于UVM的事务级建模方法。该方法可以有效地加速软件开发，而事务级模型又可以在处理器验证平台中作为黄金参考模型。

会议

集成电路事务级建模SuperV处理器设计模式软件开发

刺激脉冲对蛙类坐骨神经干CAP特性的影响

本文设计了一种获取蛙类坐骨神经干复合动作电位(compound action potential,CAP)的新实验方法。研究了采用不同刺激脉冲电刺激蛙类坐骨神经干时,记录得到CAP波形的特性。实验中分别采用电荷平衡的双相正向脉冲码、双相负向脉冲码、极性交错脉冲码、单相正向脉冲码、单相负向脉冲码刺激蛙类坐骨神经干。研究结果表明单相脉冲码较双相脉冲码产生幅度更大的CAP波形；采用正向脉冲码刺激时,获得

会议

蛙类坐骨神经干刺激脉冲码复合动作电位波形幅度

改进的DPOAE最小二乘估计方法

针对畸变产物耳声发射信号(DPOAE)比较微弱，估计结果的准确性对信噪比依赖性强的特点，本文给出一种改进的DPOAE信号最小二乘(Least Square Estimation)估计方法。该方法在估计模型中添加噪声项后，再估计DPOAE信号。仿真和实验结果表明，该方法相对于传统的最小二乘拟合(LSF)法，对DPOAE的估计更加准确，抗干扰能力更强。

会议

DPOAE信号噪声估计最小二乘拟合法抗干扰能力

基于TR069的交互电视终端分组管理的设计

终端分组管理的目标是为不同终端分组提供区分服务，这不仅可以满足交互电视业务运营的需求，还可以在不干扰正常用户业务使用的情况下，满足新业务、新运营模式的测试。为此，本文设计了终端分组管理的实体关系，采用TR069协议设计了不同分组终端的个性化参数配置、升级及日志采集流程。分析结果表明，采用TR069协议可使系统具备高扩展性、易维护性等特点。

会议

交互电视终端分组管理系统设计TR069协议

一种联合字幕语义及图像SIFT特征的视频场景分割与标注方法

其他学术论文