论文部分内容阅读
随着科技水平的发展,人工智能、AI机器人等一系列深度学习方面的研究进入了高速发展的时期,众多领域内,计算机视觉都出演着重大角色,例如在深度学习领域中的人脸识别、车辆追踪、物品识别等方面更是凸显出其重要性。算法的创新与大量的已标注数据集是实现深度学习创新前进的基础,现有的标注方式对于数据集处理需要消耗大量的人力和时间,一定程度减慢研究进展,通过对这一过程的改进,能够节省大量人力和时间,提高深度学习的科研效率。提高数据集的标注处理过程是一个极具挑战性的研究内容,在本文中为了验证性能对cvpr2013视频序列数据集进行了标注测试。对数据集进行分析后,发现视频中的内容为连续内容,同一个事物在视频中的连续帧中会连续出现,但也存在遮挡、半遮挡、变形、光暗变化等情况。基于此种情况,本文采取多目标跟踪的方式对视频中的事物进行跟踪处理,对每一帧得到的跟踪结果进行分析处理,将结果进行保存,便到了对应帧的标注结果。鉴于视频帧中,指定目标存在着多种情况需要进行处理,并且标注过程需要提高工作效率,减少标注耗时等,因此本文在算法使用上通过对公开算法的测试,选择了 KCF目标跟踪算法,并对该算法进行优化改进,使其适应应用场景。KCF目标跟踪算法通过循环矩阵实现样本的训练以构建目标模型,并且与快速傅里叶变换相结合使用,对于算法的跟踪速度有了极大的提升;对核函数加以利用,能够实现FHOG特征的融入,目的是为了能够提高算法的跟踪精确度。最后,采用同一数据集对改进后的KCF算法和其他跟踪算法进行对比,实验结果证明跟踪效果提升明显,准确率较高。论文实现的半自动化视频标注系统,目前已经完成初步研发并在周围科研实验室中进行了实际测试应用。该系统一定程度上提高了视频内容标注的速度和准确率,达到了优化标注的目的。