基于深度学习的行人重识别算法研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:mesnower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对海量的城市监控视频数据,通过智能分析代替人工查看的方式在安防领域已得到大量研究学者的关注。行人重识别作为监控视频内容分析的核心,得到了迅速的发展。其目的是解决跨摄像头后,通过行人的外观视觉特征和动作特征在海量的图像或视频库中检索特定行人的问题。对相互联网的不同摄像头拍摄到的行人身份进行关联,以便及时获取特定行人的运动轨迹。现实生活中由于监控环境复杂多变,摄像头安置位置各异以及光照强弱不同等影响因素,使得同一行人在不同摄像头下捕获的图像不一致,加大了行人重识别难度。针对不同场景下影响因素对行人重识别精度的影响,本文以卷积神经网络为核心,提出两种可有效提升重识别精度的网络模型。主要研究内容如下:1)针对摄像头捕获的行人图像中存在的噪声、行人之间部分遮挡以及动作姿态多变对重识别的影响,提出了一种基于时空注意力机制的行人重识别算法。首先采用Res2Net-50提取多尺度行人特征,同时采用注意力机制对基础骨干网络提取的原始特征图中未被激活或错误激活的部分区域进行重新标定筛选,以提取更具区分力的行人特征。其次采用3D聚合模块对重新筛选后的帧级行人特征进行聚合,以充分利用视频序列中的时空信息,获得最后代表整个视频序列的具有鲁棒性的行人特征向量。经过在i LIDS-VID、PRID-2011以及MARS三个数据集上进行大量消融实验,rank-1分别达到85.5%、92.7%以及85.6%,优于目前大多数方法。2)针对视频序列中存在的时空依赖以及行人特征图比较时出现的空间错位问题,提出了一种基于非局部3D密集卷积神经网络的行人重识别算法。首先采用3D密集卷积神经网络代替2D卷积操作,同时提取时空维度特征,充分挖掘输入样本序列中隐藏的时空信息。其次为了有效捕获视频序列中远距离的时空依赖,同时解决行人特征图之间空间未对齐使得重识别准确率降低的问题,在3D密集卷积块中加入非局部块,通过非局部操作计算特征图中任意两个空间位置存在的相互关系进而对特征图中存在的远距离依赖进行捕获,同时解决空间错位问题。经过在i LIDS-VID和MARS两个数据集进行多组消融实验,rank-1分别达到84.3%和87.8%,证明该方法具有优异的性能表现。
其他文献
习近平总书记指出,干部干部,干是当头的,既要想干愿干积极干,又要能干会干善于干,其中积极性又是首要的.央企地市级分公司作为直接面向市场、面向客户的基层企业,中层以上领导干部是中坚力量,应该积极践行、率先垂范.rn学习知识、掌握知识、应用知识和传播文化rn中层以上领导,首先要学好本专业应知应会知识,成为行家里手,成为员工的表率和导师,这是最基本的要求;其次要具备一定的专业水准、管理能力和职业操守,这是必备的素质;再次学习的目的全在于应用,坚持做到学习再学习,实践再实践,成为企业文化的践行者和传播者,这是最高
期刊
元宇宙是正在兴起的概念,是人工智能技术发展的大背景下诞生的技术奇点.目前,元宇宙概念引发了人们广泛的讨论,它基于扩展现实技术提供沉浸式体验,基于数字孪生技术生成现实世界的镜像,基于区块链技术搭建经济体系,将虚拟世界与现实世界在经济系统、社交系统、身份系统上密切融合,并且允许每个用户进行内容生产和世界编辑.这就相当于一个人造的平行世界,人们可以享受在其中做“造物主”的感觉.元宇宙本身具备的典型特征势必需要对大量的数据进行训练,只有人工智能才能驾驭这巨量的数据.本文从人机交互与AI的发展历史为起点,探讨了人工
期刊
超连续谱具有光谱范围宽、功率高和低相干性的特点,非常适合应用于光学相干断层扫描系统。而1.6μm波段的激光位于水吸收和散射谱的低谷位置,能够有效降低水吸收和散射损耗,可作为光学相干断层扫描系统的理想光源。因此,本论文在1.6μm锁模光纤激光器基础上结合非线性效应探讨了1.6μm波段超连续谱的产生,并将超连续谱应用在光学相干层析扫描技术中。具体研究内容如下:1.设计基于非线性偏振旋转(NPR)锁模机
毋庸置疑,“绿色公路”是公路交通领域当下的热词.建设绿色公路是践行生态文明思想、深化绿色发展理念、助力美丽中国建设的必然要求,也是支撑交通强国建设、实现行业转型升级的关键举措,具有十分重要的意义.rn站在“绿色交通”的视野下审视绿色公路,中国工程院院士孙永福认为,公路行业应该抓住交通基础设施建设的“窗口期”,围绕交通一体化和高质量发展精准发力,突出绿色交通基础设施的支撑,实现交通基础设施的绿色建设与养护,抓住新技术、新业态的发展契机,实现绿色发展.
期刊
为了实现GaAs基量子阱半导体激光器更宽的光谱范围,InGaAs/GaAs应变量子阱被广泛应用在量子阱激光器中。同时,应变多量子阱可以实现更高的材料增益,但随之而来的应变积累会引发晶格错配,并出现层-层生长模式向层-岛生长模式转变等问题,给外延生长带来一定难度。与传统无应变GaAs势垒相比,GaAsP势垒作为一种拉伸应变材料,可在InGaAs量子阱结构中减小应变积累,增加临界厚度。并且在量子阱激光
日前,各地纷纷出台“十四五”规划,清晰勾勒出“十四五”期中国港口发展蓝图.rn山东省政府办公厅印发《山东省“十四五”海洋经济发展规划》,清晰勾勒出“十四五”山东海洋经济发展蓝图.在“一核引领、三极支撑、两带提升、全省协同”的发展布局中,港口元素不仅以“建设世界一流的海洋港口”为题独立成篇,而且在与港口相关的物流、金融、贸易、港产城融合等内容多元渗透、充分延伸,成为《规划》的亮彩.对山东港口而言,这既是一体化改革发展中的山东港口必须肩负的时代重任,也为山东港口转型发展、高质量发展带来了“新风口”、注入了新动
期刊
背景:迁移赔补与日俱增,风险凸显rn运营商网络资产迁移赔补业务主要指因城镇道路、市政设施新增改建导致通信设施迁改、维修或损坏,政府部门、独立法人机构或个人等主体给予电信企业的赔偿或补偿.rn近年来,城市基建不断加强,轨道交通与高速公路铺展开来.运营商面临着日益增长的网络资产迁移及较大规模的补偿款.据统计,某省电信公司2013年至今产生迁移赔补合同8000余份,合同金额约40亿元;其中,某地铁线通信管线改造项目跨期3年.由此可见,运营商迁改业务存在数量多、金额大、周期长等特征.
期刊
随着我国大型装备制造业的快速发展,在航空航天、汽车制造、船舶等领域对大尺寸对象的测量需求越来越多,高效率、高精度的大尺寸测量技术是我国研究人员不懈追求的目标。传统的测量技术由于测量范围有限、操作复杂等因素,不能较好的保证大尺寸测量对象的测量精度及测量效率。本文针对大尺寸对象单系统站位测量效率低下、视觉测量需要布设大量合作靶标、全局扫描精度低等问题开展了面向大尺寸对象的组网式视觉跟踪扫描技术研究,对
语音作为信息交互的媒介,相较于其它的交互方式,其表达更直观简洁。通过语音交互传递信息更加自然、灵活且传递效率更高。在现实生活中,语音的采集和识别系统的性能与接收到的目标音频的质量有关,然而语音信号在编码、传输过程中无法避免与噪声产生混杂,导致语音采集和识别的结果较差。通常使用语音增强技术来处理带噪语音信号是为了抑制噪声对语音产生的影响。大多数语音增强算法为了降低算法的复杂度,对不同类型的噪声采取相
科技的飞速发展总是让生活在21世纪的我们感到应接不暇,但又必须深刻地认识到“科学源于生活,并在以惊人的速度改变着生活,创造着崭新的历史,带领着我们向着更加美好的方向前行”.生命科学作为与我们息息相关的科学更是如此,甚至有人称“21世纪是生命科学的世纪”.
期刊