论文部分内容阅读
目前,对视频进行场景分割的通用方法一般仅依赖于视频的视觉特征,导致其分割速度慢准确率不高。试图针对电影类视频给出一种更实用的场景分割方法,为此在视觉图像特征之外该文还利用了电影中的对白(字幕)信息。发现某条字幕呈现时间段内的视频帧一般不出现场景切换点。基于这一事实,切分出每条字幕持续时间段内视频帧作为进行场景聚簇的最小单元。然后,综合利用了最小单元对白文本的主题以及最小单元所包含的视频图像帧的相似性对不同最小单元进行聚类,得到场景。实验结果表明,与基于场景转移图的方法相比,方法优势明显,而且避免了繁琐的场景标注过程。