基于计算机视觉的人体动作识别研究

来源 :华北电力大学 | 被引量 : 0次 | 上传用户:lvshuijing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着传感器技术、互联网的快速发展和机器学习理论的成熟,视频人体动作识别技术越来越得到研究人员的关注。人体动作识别技术具有较高的学术价值和商业价值,可以在人机交互、智能监控、运动分析、视频检索等多个场景得到应用。传统的人体动作识别方法的效果很大程度上依赖于人工提取出的特征的优劣,特征的计算过程复杂,提取出的特征泛化性不强。本文采用深度神经网络模拟生物大脑对于视觉信息的处理过程,实现视频人体动作特征提取,能够适应复杂环境下的人体动作识别,简化了传统人工特征提取的流程,同时提高识别准确率。首先,本文构建了扩展到三维的3D卷积神经网络模型。考虑到运动过程中人体变化显著区域对动作识别的影响,本文使用三帧差法计算人体运动前后变化区域得到帧间差分通道,同原始灰度视频通道一起构成双通道输入进本文构建的3D卷积神经网络,进行特征提取。在KTH数据集上的实验表明,使用本文构建的双通道3D卷积神经网络可以达到92.5%的识别准确率,在减少特征提取工作了的同时获得了较高的算法鲁棒性。另外,本文通过对比实验研究了3D卷积神经网络中网络结构和各类参数对识别性能的影响,其中,3×3×3的卷积核识别准确率略低于5×5×5,但有着更高的效率;对数似然代价函数相较于普通的均方差函数有着更快的收敛速度;dropout可以在一定程度上避免小数据集上的过拟合。然后,为了能够在UCF-101这类数据量大、视频内容丰富、背景环境复杂的数据集上提取出足够的特征,本文利用利用迁移学习原理,使用CNN预训练模型,将预训练模型在ImageNet数据集上训练好的分类网络的权值迁移到本文使用的UCF-101人体动作识别数据集上进行微调,辅助提取视频帧中的人体动作特征。针对现实中的人体动作执行时间差异,本文并未使用传统的帧对齐方式,而是使用LSTM网络对变长人体动作序列进行识别。使用CNN预训练模型和LSTM网络的人体动作识别模型在UCF-101数据集上取得了88.7%的准确率,验证了该模型在视频人体行为识别上的有效性。
其他文献
对流层大气波导是一种重要的大气折射类型,能够使超短波及以上频段无线电波形成超视距传播。大气波导的感知是合理利用大气波导,或规避大气波导的不良影响的前提条件。近年来,关
目的 考察加替沙星与酚磺乙胺在5%葡萄糖注射液中配伍的稳定性。方法 采用紫外分光光度法测定加替沙星与酚磺乙胺配伍后的含量,并测定pH值,观察外观、性状变化。结果 在4℃、25
高校弘扬雷锋精神的关键是弘扬雷锋服务人民、助人为乐的无私奉献精神。高校弘扬雷锋精神的途径是以树立为人民服务的政治理念、树立以学生为本的主体理念、树立教育生活化的
一、引言化学概念教学是初中化学教学中的关键组成部分~([1]),是学习化学的基础,化学知识体系的形成依赖于化学概念的正确构建~([2])。化学概念是化学现象、原理等感性知识归
<正>李书有南京大学哲学系、宗教学系教授,博士研究生导师江南文化研修学院院长世界易经大会创会主席,主席团成员《建筑与文化》杂志编委2月14日,南京大雪。下午三点,李书有
组合合成是建立在高效、快速、平行合成基础之上,这种合成新方法步骤较少,但底物和试剂较多样,故生成的化合物数量巨大,因此组合化学以其制备能力大的优点在生物学合成和化学
目的:沿神经分布的皮损和神经痛是带状疱疹的典型症状,其神经痛常发作剧烈、持久,甚时让人无法忍受、痛不欲生,严重影响患者的生活质量。因此,许多临床工作者越来越重视对该病的研
研究目的:1.了解某职业技术学院中高职新生的心理健康状况。2.探讨中高职新生心理健康现状、干预效果、影响因素。研究方法:以山西省某职业技术学院2013级1822名新生为调查对象
目的:通过病例对照研究的方法,观察《伤寒杂病论》经方——“百合地黄汤”,对阴虚型心理亚健康人群进行干预的结果,进一步探讨心理亚健康中医传统经方的预防保健作用。方法:确
当物质生活得到满足后,人们开始着重关注精神生活。于是“公益”这样的褒义词汇越来越频繁的出现在人们的日常生活中。它代表了我们所处的这个时代人性光辉的一面,而海报以其