论文部分内容阅读
随着社会的进步和技术的不断发展,各种视频采集设备每天都在产生海量的数据,视频的自动化智能分析逐渐成为一种必须。行为识别因其具有广泛的应用,是视频智能分析研究领域的一个热点,得到了工业界和学术界的广泛关注。 近年来被广泛关注的深度学习算法已经被成功运用于语音识别、图像识别等领域。本文在学习和研究国内外人体行为识别方法的基础上,重点研究并实现了基于时空信息的深度神经网络人体行为识别。基于Cuboid和三维梯度方向直方图(3DHistograms of Oriented Gradients,HOG3D)的人体行为识别是基于时空兴趣点的行为识别方法的一种,本文首先使用该方法进行了实验,然后重点研究了基于独立子空间模型(Independent Subspace Analysis,ISA)的人体行为识别和基于长短时记忆人工神经网络(Long Short Term Memory, LSTM)的人体行为识别方法。基于Cuboid和HOG3D的人体行为识别方法首先使用Cuboid检测算法在视频中进行时空兴趣点的检测,使用HOG3D对检测到的时空兴趣点进行描述,使用词袋模型将一组兴趣点的特征向量转换为一个统一长度的直方图特征向量,最后使用支持向量机进行识别。基于ISA的人体行为识别方法首先使用原始视频数据对ISA模型进行无监督训练,然后将训练好的ISA模型应用到视频块的描述过程中。基于LSTM的人体行为识别首先使用卷积神经网络对视频中的每帧图像进行描述,并使用LSTM神经网络对特征向量的时间序列进行学习和识别,因LSTM能够对时间序列的长度具有很强的适应性,所以其在人体行为识别上具有更多的优势。 本文在KTH,UCF Sports,Hollywood2数据库上对文中的方法进行了实验,通过结果的分析和对比,证明了本文所研究算法的有效性。