论文部分内容阅读
视频目标跟踪一直是图像处理一个非常重要问题,广泛应用于智能监控中。为了解决目标消失、长时间跟踪目标,捷克的Z.Ka1a1提出了一种在线学习的TLD算法。在此背景下,本文深入研究了TLD目标跟踪算法。着重介绍了该算法的整个实现框架和设计思路,并且详细分析了该算法的核心模块,即检测模块、跟踪模块、学习模块和综合模块。在详细分析TLD算法的基础上得知,TLD算法性能良好,在形变、光照等干扰条件下均能保证跟踪目标不被丢失,自适应能力强。但是传统的TLD算法只对单目标跟踪问题给出了解决方案,对于在视频中同时跟踪多个目标问题没有具体分析。因此在研究TLD算法基础上,本文对TLD目标跟踪算法进行了扩展,给出了一种基于该算法的多目标跟踪解决方案。本文从实际应用场景出发,结合TLD单目标跟踪算法,给出了多目标跟踪算法实现框架。详细介绍了多目标框架中各个模块的具体改进过程。主要的改进内容如下:在多目标跟踪模块采用新的数据结构存贮数据;在跟踪模块特征点的选取给出了新的方法;对检测模块中为了减少多目标生成滑动窗口的数量问题,对多个目标框的大小进行了归一化处理;在检测模块和学习模块中对于多目标集合分类器和方差分类器中的设计和样本更新做出了改变。在本文的最后,展示了该框架下多目标跟踪算法的实际运行效率并且在实际环境对该多目标算法进行了相关测试,指出了该多目标算法的优点和缺点,为后续研究指明了方向。