基于卷积神经网络的LDA视频检索的研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:waterxiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolutional Neural Network, CNN)在图像视频分析中比传统方法有更高的准确率和快速的处理速度,利用CNN进行视频特征生成是一个重要方向。隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型不仅在文本领域得到广泛应用,并且近来在图像处理领域也得到应用。本文结合LDA提出了视觉主题模型,定义视觉字和视觉主题,降低视频的维度。本文设计了基于卷积神经网络的LDA视频检索系统,并研究了系统实现过程中的视频特征生成、视频特征表示等方法,最后对系统进行了实现和性能比较。本文的主要工作和研究的重点内容如下:(1)视频具有数据量大的特点,需要进行大量预处理降低数据量。本文通过抽取视频关键帧,可以简化视频的内容。本文使用块划分方法选取出一帧中信息量大的目标对象块,进一步简化视频结构。(2)简化视频结构后,需要提取视频的底层特征。目前主流的视频底层特征如颜色直方图,没有形状、纹理等信息并且对颜色的改变比较敏感。局部特征可以采集目标对象信息,但直接计算视频间相似性比较耗时。本文采用卷积神经网络方法,对视频进行底层特征提取,保留更多的视觉信息,提高视频检索的性能。(3) CNN视频特征维度较高,直接用于检索计算量大,需要进行数据降维。词袋模型Bag of Words (BoW)可以将视频特征运用聚类算法映射到词语空间,获得视频的视觉词语表示。在此基础上本文利用LDA提出了狄利克雷视觉主题模型,可以将视觉词语映射到视觉主题空间,获得视频的主题概率分布,进一步简化视频表示。(4)本文设计和实现了基于卷积神经网络的LDA视频检索系统,并将所提出的方法与前沿BoW视频检索方法进行对比分析,根据实验结果分析证明本文方案具有可行性、通用性、高效性。
其他文献
目的 总结142例颅骨肿瘤病例,以提高对颅骨肿瘤的认识,从而提高颅骨肿瘤的诊断、治疗与预后。 方法 从发病率、年龄、性别、发生部位、病理学特点、影像学表现、诊断鉴别
SCADA(Supervisory Control and Data Acquisition)系统,全名为遥测遥控系统。现在的基于分布式计算机网络以及关系数据库技术的能够实现大范围联网的第三代SCADA系统被广泛应
在我们的生活中存在着众多不平等的现象,对不平等进行描述的概念很多,阶级/阶层是其中最重要的范畴之一。马克思主义的阶级理论对阶级之间的不平等作了细致的分析,并提出了消除这
基于视频和DSP车辆识别测速系统是智能交通系统(ITS)中的一个组成部分,它集牌照识别,车速检测,流量监控,费用收取等功能于一体,主要应用于超速违章车辆监控。 本论文介绍的作者
随着经济体制改革深化,国有企业大量冗员被排出企业,成为下岗失业人员。同时,农村大量剩余劳动力涌入城市,其中许多人成为城市各类企事业单位的合同工,这些农民合同工的工作极不稳
《三国史记》作为朝鲜现存最古老的史书,其历史文献价值早已得到学界广泛的承认和研究,但其文学价值却没有引起足够的重视,究其原因,是许多人认为《三国史记》中具备文学性的只是
财务公司是继银行之后发展起来的一种新型的金融机构,它的英文名是Finance Company或Finance Services,它最初向消费者提供购买消费品的融资服务,以后业务范围逐渐扩大,近年来业