论文部分内容阅读
随着智能监控的发展,行人再识别在智能视频监控领域的实际应用价值和理论研究意义日益凸现。行人再识别是给定目标图库,在监控摄像头下采集的数据集中使用计算机视觉技术进行判断图像库或视频序列中是否存在给定目标的技术。随着计算机硬件性能提升,基于深度神经网络的行人再识别研究引起了广大研究者们的兴趣,成为目前计算机视觉研究热点。该研究涉及图像处理、计算机视觉、机器学习、图像检索等诸等多研究领域,具有重要的科学意义,可广泛应用于计算机视觉的应用领域,如:智能安防、安保等领域,具有良好的应用前景。在实际应用中行人图片面临着分辨率低、人体姿态和拍摄视角差异大、障碍物遮挡等诸多问题,这些问题将导致人的表观差异较大。针对这些问题导致的低质量图像和序列内图像的差异性问题,本文考虑帧间丰富的时序信息,在质量感知网络的基础上,提出了一种有监督的时序注意力质量感知网络,通过提取帧间时序信息,融合了单帧图像空间内特征和帧与帧之间的运动特征,从而在所有帧序列之间能够有效地聚合互补信息,显著地降低了低质量图像区域的影响,提高了低质量图像的鲁棒性。然而有监督的方法需要大量标注的训练数据,在现实场景中的大规模数据标注难以实现。针对该问题,本文进一步提出了一种基于无监督深度聚类网络模型的行人再识别方法,该方法根据跨相机之间的多样性和单相机内的相似性,将单个样本看作一个不同的标识开始,引入一个多样性正则化项来平衡每个聚类的数据量,最大化每个标识的多样性进行聚类,然后逐渐将相似的样本组成一个身份ID进行聚类合并,实现了多样性和相似性的有效平衡。为了验证本文提出的方法的有效性,本文在四个公开的数据集上(PRID 2011,iLIDS-VID,CUHK03和Market1501)与最近相关的算法进行了实验比较,实验结果表明本文提出的方法在识别匹配率和计算效率上具有较好的效果。