【摘 要】
:
随着互联网技术的发展及智能手机等设备的普及,互联网上的视频数据每天都在以爆炸性趋势增长。如何对网络中的视频数据进行分析识别,对于视频的分类、存储、检索都有着至关重要的作用。而在视频分析研究中,基于视频内容的人体动作识别是其中最为普遍且最为关键的主要任务,在互联网异常视频检测、智能监控、人机交互以及军事领域都有着广泛的实际应用前景。有效提取视频中的时空信息是视频动作识别任务中的关键问题,3D卷积神经
论文部分内容阅读
随着互联网技术的发展及智能手机等设备的普及,互联网上的视频数据每天都在以爆炸性趋势增长。如何对网络中的视频数据进行分析识别,对于视频的分类、存储、检索都有着至关重要的作用。而在视频分析研究中,基于视频内容的人体动作识别是其中最为普遍且最为关键的主要任务,在互联网异常视频检测、智能监控、人机交互以及军事领域都有着广泛的实际应用前景。有效提取视频中的时空信息是视频动作识别任务中的关键问题,3D卷积神经网络由于能够有效提取视频动态特征,是视频动作识别领域的主要方法。但3D卷积神经网络存在参数量过大及识别效果较差两个严重缺陷。本文基于深度学习方法,构建一种3D残差神经网络框架,能够有效提取视频动态特征从而进行视频动作识别,并在如何有效降低3D卷积神经网络参数量及如何有效提高3D卷积神经网络识别准确率两个方面进行了具体相关研究。本文的主要研究工作包括以下三个方面:(1)本文以图像领域经典的残差神经网络为基础,通过将3D卷积和3D池化引入其中,构建了一个深层次3D残差神经网络。相比于浅层3D卷积神经网络,本文构建的3D残差神经网络由于有着更深的网络层次,能够更好的表征视频运动特征,从而更有效地解决视频动作识别任务。(2)针对3D卷积神经网络参数量过大,容易出现过拟合的问题,本文提出了将深度可分离卷积引入其中以减少模型参数量。具体选取了3D残差网络作为基础模型,通过将深度可分离卷积引入其中,构建了基于深度可分离卷积的3D残差神经网络。为了进行对比实验,本文还构建了基于分组卷积的3D残差神经网络和基于分组卷积与深度可分离卷积的3D残差神经网络。相关实验结果表明,引入深度可分离卷积是保持3D卷积神经网络表现性能不受损害的条件下,最大幅度降低模型参数量的有效方法。(3)针对3D卷积神经网络无法有效地提取视频关键特征的问题,本文首先设计了一个通道注意力模块和一个空间注意力模块,能够分别为视频特征中不同通道或不同空间的信息添加不同的权重,从而更有效提取关键通道信息或关键空间信息。在此基础上,本文构建了一种全局注意力模块,能够为视频特征中任意维度上的信息添加不同的权重信息,从而使3D卷积神经网络能够更有效提取决定视频动作类别的关键信息。相关实验结果验证了全局注意力模块对于3D卷积神经网络有效提取视频关键特征的重要意义。
其他文献
移动机器人在开放环境中执行复杂任务时,通过基于对环境变化的规约来构建控制模型以驱动机器人运行。这为移动机器人这一软硬件协同工作的平台带来以下挑战:(1)开放环境的不确定性使得模型设计的先验知识缺失,从而导致机器人行为决策存在未知风险;(2)受限于物理环境与物理行为,移动机器人行为决策的执行效果与预期不完全匹配;(3)感知信息的滞后性的存在要求移动机器人在短时间内生成行为决策以避免感知信息失效。针对
作为一种典型的无人作战形式,多无人机对抗复杂多变、不确定强,一直是军事领域的研究热点。本文通过空战任务分析、多智能体系统建模、多无人机空战仿真等方法,对面向多无人机对抗任务的深度强化学习方法开展了研究。本文的研究内容主要包括:1、阐述了多无人机对抗任务的知识背景与研究价值。对多智能体深度强化学习算法与其应用领域进行了详细介绍,并将其感知与决策能力应用在多无人机协同空战,提出了面向多无人机对抗任务的
随着教育理念的不断更新,新课改的不断深入,初中体育也越发受到重视。而将德育教育渗透进初中体育中是新课改的重要内容,具有着非常意义。将德育渗透进体育教学中,能够让学生在强身健体、获取体育知识、理论、技能的同时,培养良好的体育素质与精神品质,从而帮助学生身心健康发展。本文就德育在在初中体育中的作用与如何将德育教育有效渗透进体育课堂中展开讨论,望为初中体育教学提供帮助。
网上零售商的多样化和网购的普及激发了物流业的迅猛发展。虽然大量的物流运输促进了经济的发展和服务的便捷,快递公司们仍然面临着很多挑战:1)物流成本居高不下;2)节假日快递数量激增导致物流运力不足从而屡屡发生“爆仓”现象;3)专用物流车辆加剧了交通拥堵和环境污染(如碳排放)等问题。在本文中,我们提出了基于众包公共交通系统(CPTS)的城市包裹分发与筹划(CPDCP:City-wide Package
近年来,包括协同搜索和救援在内的许多实际应用都引起了人们对机器人群体控制的极大关注。机器人群体通过单个机器人间的交互,实现机器人群体的协同运动,具有空间和功能的分布式和高容错性等特征。使得机器人群体大于个体之和,机器人群体可以执行单体机器人难以完成的复杂任务。机器人群体控制仍面临很多挑战,例如机器人群体避障时的群集一致性问题。这是由于未知环境下,机器人彼此之间的交互和环境的交互同时进行,频繁且量大
当代科技革命、产业革命和新军事革命的发展,使得计算机技术、互联网技术、数字通信技术等新兴技术不断涌现,从而引起社会深刻变革,对情报工作也产生深远影响,它们既丰富了情报搜集手段、加快了情报分析和传输速度,也给情报管理、情报机构建设带来巨大挑战。面对这一形势,美国依托强大的科技和经济实力,积极推动“军民融合”发展战略,并将军民合作的内容扩展到情报领域,主张在情报工作领域推进军民融合式发展,充分利用民间
社会心态是一段时间内由弥散在整个社会或社会群体/社会类别中的社会共识、各类需求满足与否的感受、社会情绪及社会价值观、社会行为共同构成的一种社会心境状态。社会需求是社会心态的动力基础,社会需求的满足与否通过情绪感染推动民众弥漫性社会情绪的产生,进而通过社会认同和沟通形成社会共识,而社会共识进一步积淀形成更稳定的社会价值观。社会情绪、社会共识和社会价值观又共同影响民众的社会行为,体现了社会心态中社会需
异构传感器智能监视网(Heterogeneous Sensor Intelligent Surveillance Network,HSISN)是由部署在特定监测区域内、搭载各类传感器且具有一定感知、计算和通信能力的传感器节点通过无线组网实时协作构成的监视网络系统。系统能够采集和处理被监控区域内的环境信息,并通过无线网络将信息上传到控制中心,从而达到远程监视的目的。系统具有快速部署、精准感知、成本低
冷冻电子显微技术(cryo-EM)在结构生物学中得到越来越广泛的应用。在应用冷冻电镜技术对分子结构进行三维重构的过程中,显微图像中颗粒的挑选效果影响着后续的颗粒分类和分析的质量,直接关系到最终三维重构的分辨率。本文考察了目标检测中的深度学习算法,对卷积网络的结构、目标检测的分类算法和目标框的坐标回归机制进行了研究。在此基础上,本文提出了一种RSelector卷积神经网络方法,用于冷冻电镜图像中的颗
通信信号调制识别技术是在非协作通信情况下,对接收信号的调制样式进行识别,它属于信号检测和解调的中间环节,是一项非常重要的技术。在民用领域常被用于频谱监管,在军事领域常被用于通信侦察、通信干扰等。本文针对现有的调制识别算法在低信噪比下识别率低、人工提取特征适用性差等问题,对基于特征提取的调制识别算法进行研究,根据特征提取方法的不同,研究包括两个方面:一是基于人工特征方面。研究了新型信息熵特征和传统循