基于时空信息的深度神经网络人体行为识别

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:wanghan0106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的进步和技术的不断发展,各种视频采集设备每天都在产生海量的数据,视频的自动化智能分析逐渐成为一种必须。行为识别因其具有广泛的应用,是视频智能分析研究领域的一个热点,得到了工业界和学术界的广泛关注。  近年来被广泛关注的深度学习算法已经被成功运用于语音识别、图像识别等领域。本文在学习和研究国内外人体行为识别方法的基础上,重点研究并实现了基于时空信息的深度神经网络人体行为识别。基于Cuboid和三维梯度方向直方图(3DHistograms of Oriented Gradients,HOG3D)的人体行为识别是基于时空兴趣点的行为识别方法的一种,本文首先使用该方法进行了实验,然后重点研究了基于独立子空间模型(Independent Subspace Analysis,ISA)的人体行为识别和基于长短时记忆人工神经网络(Long Short Term Memory, LSTM)的人体行为识别方法。基于Cuboid和HOG3D的人体行为识别方法首先使用Cuboid检测算法在视频中进行时空兴趣点的检测,使用HOG3D对检测到的时空兴趣点进行描述,使用词袋模型将一组兴趣点的特征向量转换为一个统一长度的直方图特征向量,最后使用支持向量机进行识别。基于ISA的人体行为识别方法首先使用原始视频数据对ISA模型进行无监督训练,然后将训练好的ISA模型应用到视频块的描述过程中。基于LSTM的人体行为识别首先使用卷积神经网络对视频中的每帧图像进行描述,并使用LSTM神经网络对特征向量的时间序列进行学习和识别,因LSTM能够对时间序列的长度具有很强的适应性,所以其在人体行为识别上具有更多的优势。  本文在KTH,UCF Sports,Hollywood2数据库上对文中的方法进行了实验,通过结果的分析和对比,证明了本文所研究算法的有效性。
其他文献
近年来移动通信市场的高速膨胀有力地推动了移动通信事业的发展,同时通信技术也得到了快速的发展。目前,中国在第三代移动通信的发展上取得了举世瞩目的成果,第三代移动通信
前言从十九世纪末开始,日本、德国、苏联、朝鲜和中国学者就开始了对人参化学成分的研究,迄今,从人参中分离并确定了结构的皂甙成分已达40余种。研究表明人参皂甙Rg3是其中活
信道均衡是改善通信系统性能,提高通信质量的一个极其重要的环节。使用信道均衡技术,可以有效消除码间干扰(ISI)带来的影响。自从Lucky提出自适应算法思想以来,很多学者对自
多载波传输技术在当前无线通信领域中应用广泛,尤以正交频分复用(OFDM,Orthogonal Frequency Division Multiplexing)技术最为热门。但是,由于循环前缀(CP,Cyclic Prefix)的
合成孔径雷达(Synthetic Aperture Radar, SAR)是利用被测目标和雷达平台之间的相对运动,在一定的积累时间(合成孔径时间)内,将在雷达不同空间位置上接收到的回波信号进行相
由于高带宽的要求和现有频率资源的紧张,下一代移动通信系统很可能工作在3GHz以上的频段。高频段无线电信号的衰减比现有的1到2GHz频段要严重得多,这会导致小区边缘的用户信
随着社交平台(例如,微博、Twitter、Facebook等)的兴起,信息分享变得更加便利,多媒体信息呈现出爆炸式的增长,整个互联网不再只有文本信息,而是文本、图像、音频、视频等多样化的信
学位
学位
三尖杉是我国一级保护树种,具有很高的药用价值,但是现存的自然资源有限,天然更新又极其困难。目前主要集中在三尖杉酯碱抗癌性能研究较多,而对于三尖杉生理活性和生化特性了解甚