论文部分内容阅读
单目标视觉跟踪是视觉跟踪领域中最基础的问题。它旨在根据给定目标的初始位置和初始信息,在随后的视频序列中估计目标的位置和尺度变化,以便完成更高级的任务。视觉跟踪任务的难点首先在于可获得的关于给定目标的训练数据非常有限。其次,跟踪模型面临现实应用场景中存在的遮挡、形变和尺度变化等诸多挑战。最后,视觉跟踪任务对处理速度的要求进一步提升了算法设计的难度。基于相关滤波的跟踪算法根据样本近似循环的特点,利用循环矩阵可转化为频域对角矩阵的性质和快速傅里叶变换,高效实现判别器训练和目标跟踪,受到了广泛的关注和快速发展。但是相关滤波跟踪算法存在边界效应问题,模型判别能力也比较低。本文针对这些问题,通过引入卷积回归网络求解相关滤波中的脊回归模型,避免了边界效应的发生,并针对此方法存在的训练样本不平衡和使用分类网络提取特征容易受到背景中相似物体干扰的问题,提出了两种基于注意力机制的卷积回归网络算法。在标准的视觉跟踪数据集上进行评价,本文提出的算法均表现出了优良的跟踪性能,可以为复杂场景下的视觉跟踪提供较好的理论和技术支持。主要工作如下:
(1)提出了一种基于空间正则化矩阵的核相关滤波跟踪算法。通过引入空间正则化矩阵到核相关滤波跟踪算法所使用的脊回归模型中来抑制边界效应,并利用循环矩阵的特性高效求解脊回归模型,获得新的相关滤波器。在提升算法跟踪性能的同时保持相关滤波跟踪算法的实时性。在OTB-2015数据集上,相比于KCF,跟踪准确率提升了0.114,跟踪成功率提升了0.127。
(2)提出了一种基于带权重循环样本的最大间隔跟踪算法。为了增强模型的鲁棒性,采用支持向量机(SVM)的模型建模跟踪。在设计模型时,对每个训练样本加一权重来抑制边界效应。同时,设计一种新的模型更新策略来判断跟踪结果是否准确,进而决定是否进行模型更新,防止不准确的跟踪结果污染目标模型。在OTB-2015数据集上,相比于KCF,跟踪准确率提升了0.125,跟踪成功率提升了0.128。
(3)提出一种基于残差注意力机制的在线卷积跟踪网络。使用卷积回归网络求解相关滤波的脊回归模型可以避免边界效应,但是也存在着训练样本不平衡的问题,通过引入残差注意力机制到卷积回归网络以抑制这个问题,使用空间注意力和时间注意力两种激活函数获得注意力,从不同角度获取训练样本的注意力值。在OTB-2015数据集上,相比于SRDCF,跟踪准确率提升了0.056,跟踪成功率提升了0.028。
(4)提出一种基于双残差注意力学习的在线视觉目标跟踪算法。针对跟踪算法容易受到背景中相似物体干扰的问题,通过特征感知残差注意力学习注意图,根据当前视频序列给定的目标选择和增强目标的深度特征。背景感知残差注意力学习中:主分支提取稠密的样本并输出与样本集相对应的响应矩阵,残差分支学习目标及其周围背景的结构信息来修正主分支输出的响应矩阵。在OTB-2015数据集上,相比于CREST,跟踪准确率提升了0.038,跟踪成功率提升了0.021。
(1)提出了一种基于空间正则化矩阵的核相关滤波跟踪算法。通过引入空间正则化矩阵到核相关滤波跟踪算法所使用的脊回归模型中来抑制边界效应,并利用循环矩阵的特性高效求解脊回归模型,获得新的相关滤波器。在提升算法跟踪性能的同时保持相关滤波跟踪算法的实时性。在OTB-2015数据集上,相比于KCF,跟踪准确率提升了0.114,跟踪成功率提升了0.127。
(2)提出了一种基于带权重循环样本的最大间隔跟踪算法。为了增强模型的鲁棒性,采用支持向量机(SVM)的模型建模跟踪。在设计模型时,对每个训练样本加一权重来抑制边界效应。同时,设计一种新的模型更新策略来判断跟踪结果是否准确,进而决定是否进行模型更新,防止不准确的跟踪结果污染目标模型。在OTB-2015数据集上,相比于KCF,跟踪准确率提升了0.125,跟踪成功率提升了0.128。
(3)提出一种基于残差注意力机制的在线卷积跟踪网络。使用卷积回归网络求解相关滤波的脊回归模型可以避免边界效应,但是也存在着训练样本不平衡的问题,通过引入残差注意力机制到卷积回归网络以抑制这个问题,使用空间注意力和时间注意力两种激活函数获得注意力,从不同角度获取训练样本的注意力值。在OTB-2015数据集上,相比于SRDCF,跟踪准确率提升了0.056,跟踪成功率提升了0.028。
(4)提出一种基于双残差注意力学习的在线视觉目标跟踪算法。针对跟踪算法容易受到背景中相似物体干扰的问题,通过特征感知残差注意力学习注意图,根据当前视频序列给定的目标选择和增强目标的深度特征。背景感知残差注意力学习中:主分支提取稠密的样本并输出与样本集相对应的响应矩阵,残差分支学习目标及其周围背景的结构信息来修正主分支输出的响应矩阵。在OTB-2015数据集上,相比于CREST,跟踪准确率提升了0.038,跟踪成功率提升了0.021。