基于深度序列的人体行为识别研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:aaalxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自上世纪80年代以来,计算机视觉领域中的人体行为识别引起研究者的广泛关注。在当前的各种行为识别方法中,较大部分通过使用传统相机来解决这一问题。过去十年见证了3D数据获取技术的快速发展,尤其是微软推出Kinect以后,深度图像开始得到了广泛的应用。使用深度序列进行人体行为识别能够克服图像对光照变化,遮挡,环境变化等因素造成的影响。因此,本文主要研究基于深度序列的人体行为识别,对深度行为特征的提取进行了深入的研究。针对传统行为识别精度不高的问题,采用深度图像序列与RGB图像序列结合的方法,并将在深度图像上提取的HOGD特征与可见光图像上提取的LBP特征进行融合从而得到HOGD-LBP特征,此融合特征克服HOG特征只提取人体几何边缘信息而忽略平坦表面的问题。实验证明此融合特征比单一特征有更高的识别精度和更好的稳定性。针对深度视频序列的人体行为识别精度不高的问题,采用在深度视频序列上提取一种新的时空局部法向量特征(STLN)对行为进行描述,STLN特征描述符采用4D空间法向量直方图捕获人体运动和几何信息。本文使用多边体对4D空间进行量化。实验证明此STLN描述符能够取得较好的识别效果。针对特征袋(BoF)编码不能较好的描述特征空间布局信息,无法定位行为对象或抓取行为形态,从而导致识别精度低的问题,采用局部约束编码方法代替特征袋编码。此方法使用局部约束线性编码(LLC)标准代替特征袋编码来训练码本。LLC使用局部约束代替稀疏约束,从而可以得到局部光滑稀疏,解决大量计算时的优化过程,并且可以更好的描述4维特征空间信息。针对深度视频序列,建立一个完整的行为识别系统。首先,在深度视频序列上进行局部兴趣点检测。然后,使用4D局部法向量对兴趣点进行描述从而得到局部时空法向量特征(STLN)。其次,使用一种局部约束线性编码对得到的特征进行编码从而得到行为表示。最后,使用SVM对编码表示的行为进行识别。本文深入研究深度行为识别的特征描述。在公开的DHA、MSRAction3D、MSRDaily Activity3D深度数据库上进行实验,结果证明本文所提出的算法均能取得较好的识别效果。
其他文献
随着生活水平的提高,车辆数量日益增大造成交通堵塞、交通意外事故和车辆废气对空气的污染等交通问题。智能交通系统充分的利用现有的交通基础设施,结合不同学科对交通进行管
测量船在航行或者停泊的时候容易受到风浪、潮汐等复杂洋流的冲击和扰动,导致船载伺服系统无法高精度的跟踪运动目标,同时测量船本身的摇摆和位移带来的误差和惯性力负载,也
随着计算机技术的发展,近几年智能电子产品进入人们的生活,渐渐改变和优化人们的生活。在控制领域,同样感受到智能时代的到来。高速、稳定、可视化、智能化是现代仪表技术的
随着信息论的发展,树图模型近年来物理学,概率论和信息论界的广泛兴趣.Berger和叶中行研究了树图上某种平稳随机场的熵率存在性[2],之后叶中行与Berger又研究了树上PPG不变及遍
聚类算法是一种广泛应用于数据挖掘、机器学习、图像处理等若干领域的重要技术。进化聚类算法是聚类算法中的重要分支,本文旨在提出两种新的进化聚类算法,即混合属性进化聚类
人脸识别技术是计算机视觉的一个重要研究领域,广泛应用于证件核对、刑侦破案、人机交互控制、视频监控等方面。在过去的几十年里,研究人员已经提出了许多人脸识别算法。其中
稳定性是系统的一个基本结构特性。对大多数情形,稳定是控制系统能够正常运行的前提,因而对系统稳定性和控制研究具有重要的理论意义和实际价值并受到国内外工程和理论界的广
脑电场数值计算模型的构建是医学图像三维重建一个重要的研究领域,是进行数值计算的首要前提。本文的研究重点是构建一个脑电场数值计算模型,该模型融合了图像处理、三维重建
聚丙烯薄膜(BOPP),因其质轻、无毒、无臭、防潮、机械强度高、尺寸稳定性好、高密封性好、印刷性良好、透明性好等优点,被广泛应用于食品、糖果、香烟、茶叶、果汁、牛奶、纺织
随着计算机技术、人工智能等新技术、新理念的迅猛发展和不断创新,自主航行已经成为船舶发展的重要方向之一。为了在航行过程中能够实现自动驾驶、自主避障或者执行某些特殊