基于局部的卷积基线网络与多阶段知识蒸馏的行人再识别方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:txy123txy123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别(Person Re-identification,Re ID)是指在多个不重叠的摄像机拍摄的图像序列或视频中识别指定的行人,这项技术对于安防监控,智能零售等领域尤为重要。由于拍摄的行人图像存在光照强度、背景和遮挡等不可控因素问题,从而增加了识别行人的难度。而基于局部特征的Re ID方法在解决这些问题具有潜在的鲁棒性,但其只关注局部区域信息,忽略了与全局信息的互补,限制了进一步提高识别性能。另一方面,尽管行人再识别任务在计算机视觉领域取得令人瞩目的成就,但其对计算量和内存提出了很高的要求,这就限制了深度神经网络在实际部署中的应用。而知识蒸馏(Knowledge Distillation,KD)为构建轻量级深度学习模型提供了一个很有前景的解决方案,但当前的知识蒸馏方法大多针对分类任务、目标检测任务、分割任务等,这些具有显著性能的知识蒸馏方法无法很好的适应于行人再识别模型中,且对于行人再识别准确率最为关键的行人特征部分并未做出重点优化。本文针对以上问题,进行研究和改进:(1)本文致力于获得更好的特征表示和特征学习,发现更丰富的行人特征,将全局和局部信息结合,探索一个有效的双分支网络结构(PGAT)。本文首先将全局和局部表示与广义平均池化(Ge M Pooling)相结合,以提取更丰富的全局和局部信息;然后在全局分支中引入边缘夹角附加损失(Additive Angular Margin Loss,Arcface),将其与三元组损失(Triplet loss)联合训练,以提高特征学习能力,从而获得较好的鲁棒性;最后,在三个大型数据集上进行实验对比评估。本文提出的方法在Market-1501、Duke MTMC-re ID和CUHK03数据集上的准确度分别达到89.54%,79.86%,63.76%,在现有的方法中具有一定的竞争力。(2)考虑到对于行人再识别实际的任务需求,需要同时保证模型具有较短的推理时间和较高的识别准确率,本文提出一种适合行人再识别模型的多阶段蒸馏框架结构。针对模型提取的特征进行蒸馏,模型骨干网络的多个阶段也同时进行辅助蒸馏,将骨干网络为Res Net18的PCB网络(学生网络)的识别准确率提高到与Res Net50(教师网络)相当的水平,相比于蒸馏之前在Market1501,Duke MTMC-re ID,CUHK03数据集上学生网络Res Net18的准确度分别提高了4.21%,5.8%,5.82%。同时在最新提出的双分支网络(PGAT)上应用多阶段蒸馏方法,验证了本文提出的蒸馏方法在行人再识别模型中的有效性。
其他文献
随着液晶显示器需求量的与日俱增,显示器的生产效率就显得尤为重要。提高显示器装配线的机械自动化程度可以显著提升显示器的生产效率,同时也可以减少人力成本的投入。液晶显示器在自动化装配过程中的夹紧定位装置伴随整个装配过程,是自动化生产线的重要装置。本文针对显示器自动化装配线设计了一种基于连杆机构的对中定位夹具。首先,在对夹具使用需求分析的基础上,确定了夹具的机构形式;并采用约束优化设计方法对连杆机构的具
脑-机接口(Brain-computer interface,BCI)是通过解码用户神经系统变化意图的变革性人机交互技术,其可以补充、修复、增强,甚至部分替代原有人正常神经功能的活动,在很多领域,其应用前景广阔。情绪研究就是其中的一个热门方向,负性情绪对个体的生活与工作有或多或少的影响。本文在研究情绪调节上,引入了基于功能近红外光谱(functional near infrared spectro
语音端点检测的目的是从语音信号中区分出语音段(有声段)和非语音段(无声段),但是语音信号中往往会伴随着各种噪声,噪声的存在直接影响了端点检测的性能。本文从基于特征参数的语音端点检测方法出发,对噪声环境下的语音端点检测展开研究,具体的研究工作包含如下方面:一、针对基于单特征的语音端点检测方法所用特征在低信噪比环境下鲁棒性不佳的问题,本文将语音信号Gammatone频率倒谱系数(Gammatone F
太阳暗条存在于日冕中,是由低温高密度的等离子体组成。强烈的暗条爆发活动会影响地球磁层,严重时将导致通信设备受损,造成通信中断、航空运输导航失效等。此外,暗条作为太阳大气磁场的示踪,对暗条进行研究有助于探究太阳磁场的结构和演化规律。因此对暗条准确地检测作为相关研究的基础和前提,具有重要的科学意义。针对现有的暗条检测方法存在数据集不准确、检测结果精度不高,弱小暗条错检、漏检等问题,本文首次结合太阳磁图
刀具磨损状态监测技术是先进制造技术中的重要组成部分。刀具磨损的实时监测对于提高产品质量,降低制造成本和提高生产效率具有重要作用。然而,该技术发展至今,仍然不能够真正应用于实际加工中,也未能很好地解决变工况加工条件下精确识别刀具磨损状态的问题。为此,本文通过对车削刀具磨损状态监测技术的研究,建立了基于多特征融合和多数投票法的车削刀具磨损状态识别模型。主要研究内容及结果如下:首先,对刀具磨损状态监测的
脑-机接口是一种变革传统人机交互的技术,其中情绪脑-机接口是一类重要的脑-机交互,可望为情绪的调节、监测或评估提供定量的方法,有潜在的重要应用价值。然而,情绪相关的EEG信号特征提取与识别尚未彻底解决,面临许多挑战,因此,本文基于运动调节情绪的方式,探索合适的情绪诱发实验范式,分别提取情绪相关EEG信号的时域、频域、时-频域和空域的特征,并进行情绪相关EEG信号的特征筛选,从而筛选出与情绪密切相关
随着大数据时代的降临,信息技术发展上升到了一个新的历史阶段,影响着社会生产模式和人们生活的方方面面。智能移动设备、智能家居产品都在不停地生产数据,大量数据中也隐藏着巨大的利益价值。传统数据挖掘算法在大规模数据集上训练模型时,会出现训练效率不高,因此对传统数据挖掘算法的改进变得刻不容缓。支持向量机(Support Vector Machine,SVM)对比其他常用的数据挖掘分类算法,在算法训练过程中
语音作为人机交互效率最佳的方式,是人工智能领域的热点研究对象,但由于受环境等因素的影响,机器接收到的语音信号容易被严重干扰,导致智能设备难以获取准确的语音信息,进而影响人机交互效率。语音分离是语音增强技术的重要分支,该技术主要针对说话人之间的语音干扰,但由于语音干扰不同于噪声干扰,无法对其进行分布近似假设,因而一直以来都是学者们研究的热点。传统的基于信号处理的语音分离方法在分离过程中常丢失部分有用
互联网的飞速发展极大满足了人们信息交流的需求,促进了科技、教育、文化等方面的快速发展,并成为人们日常工作、学习和生活中不可或缺的部分。互联网技术在给人们提供服务的同时,也不断的带来各式各样的问题,对信息安全产生严重的威胁。互联网的良性发展得益于不断改善的入侵检测技术。入侵检测技术成为一种应对网络安全问题的有效方法,主要得益于其可以搜集网络上计算机系统中不同结点的有效性信息,分析和检查网络中是否存在
互联网应用的飞速发展使得传统商业交易环境产生了巨大的变化,以互联网为媒介向用户提供在线服务的方式快速普及。在线服务信誉是多种在线服务信用行为累积的结果,可以辅助用户选择出优质服务。为了提高自身影响力或者降低对手影响力,恶意用户或者在线服务提供者可能操纵、攻击信誉系统,致使在线服务的信誉失真,当利用被操控的信誉来选择服务时可能会误导用户判断,因此用户面临无法选择到满足其偏好服务的风险。信誉系统管理者