论文部分内容阅读
在现代的应用工程中,计算机视觉、人工智能成为重要的研究内容,其中目标跟踪在自动驾驶、监控安全、人机交互、智能交通等问题解决上有着重要的应用价值。视频目标跟踪作为计算机视觉领域的一个重要问题,通过给定的目标大小和位置信息,在后续图像序列中找到该运动目标。实际应用中,在提高目标跟踪效率问题的同时,需要解决目标的外观变化、场景变换、相似物遮挡、高速运动模糊等复杂问题。本文主要是针对基于相关滤波的孪生网络的目标跟踪算法进行研究,首先利用具有反高斯函数的空间正则化约束项的损失函数,反向梯度传递自适应改变初始化的余弦窗从而得到更适应该模型的余弦窗。该模型在追踪过程中固定余弦窗参数,不影响追踪的速度,在达到实时性的同时提高跟踪精度和准确率。至此为实现的第一个单目标跟踪算法,利用与相关算法相同的训练集,并在视频测试集上得到较好的跟踪效果。上述的目标跟踪算法虽然可以在一般场景的视频上达到实时性和较好的跟踪效果,但是模型更新采用保留新样本,丢弃老样本的策略,在跟踪目标发生遮挡和丢失的情况下容易发生漂移,使学习到的滤波器被背景和遮挡物污染。故本文除了在空间上加入一定约束,也在时序上研究模型更新策略。本文先是在追踪阶段利用高斯混合模型,将历史帧按照特征相似度分配在相应的槽内,实现组内相似度高组间差异大的分布情况,从而得到多样性的模板。此方法使得原算法在保持追踪速度不受很大影响的情况下,提升了原算法在标准库中的跟踪精度和准确率。本文除了在追踪阶段对模型进行分组更新,在训练阶段也利用门信号控制模型分组的存储更新机制,使得模板具有多样性的同时卷积神经网络得到的特征也更有判别力,从而提高跟踪器的精度。训练阶段的模板存储、更新利用门信号来控制不同输入特征对应的槽内位置以及融合方式。该部分从训练和跟踪两个阶段对模板更新方式进行研究,在视频标准库中有较好的跟踪结果,应对长视频以及跟踪目标发生明显特征变化的特定场景中有着更好的表现。最后,本文结合以上的研究内容实现一个单目视频跟踪系统,该系统可选择不同方法下的跟踪模型,对测试视频进行目标标定后实时显示目标跟踪结果,同时在不同方法下调整合适的参数达到更好的跟踪效果。