基于深度学习的视频目标跟踪算法改进策略研究

来源 :海南大学 | 被引量 : 0次 | 上传用户:blackfairy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是计算机视觉领域重要的分支之一。作为一项基础任务,目标跟踪在经历了数十年的发展后,已经广泛应用于各个领域,如自动驾驶、虚拟现实、海洋监测、智能安防、卫星跟踪、天文观测、医学图像等。视频目标跟踪的主要任务,是从视频中找到待追踪目标,精准定位目标位置,预测目标的大小、形状等,为后续任务提供准确的目标信息。目前的目标跟踪网络,普遍存在高精度低成功率的情况,如何提高跟踪器的成功率,增强鲁棒性仍然是一个巨大的挑战。同时,主流目标跟踪算法普遍采用有监督学习,对数据集依赖严重,不利于增强网络泛化能力,如何训练一个对数据集依赖较小的网络,也是需要解决的问题。本论文通过分析当前优秀的目标跟踪算法,分别针对低成功率和数据集依赖的问题提出了两个策略:边界框集中化策略(BCS)和半监督学习策略(HLS)。论文中利用BCS设计了椭圆形边界框(EB)和矩形边界框(RB)两种新的边界框对Siam FC++进行改进,并在OTB和VOT数据集上进行了测试,测试结果表明,BCS对目标跟踪网络的性能有良好的提升效果。在另一组实验中,HLS被用于对Siam FC++进行半监督学习的改进,在各方面性能下降不超过1%的条件下,将数据标注量降低到原标注量的1/20,且HLS对数据集的目标分布无要求,使目标跟踪算法一定程度上摆脱了对数据集和数据标注的依赖,极大地方便了数据的扩展。
其他文献
汉语进入法国中等教育体系后,成为了法国中学生高考的考试科目之一。如今,法国大部分高中每周都会有2.5-3课时的汉语课,作为第二或者第三外语修读课。法国高考对第三外语修读课的考查仅限于口语考查,要求学生最低水平达到《欧洲共同语参考标准》的A2水平,即HSK2级即以上水平。根据这一教学理念,法国学者编写了针对中学生的本土汉语教材,例如于2016年出版的《你说呀》。同时,孔子学院总部的学者在参考《HSK
本论文旨在探讨英国中小学基础教育阶段多元文化教育对于英国国家身份认同培养的影响与意义,寻找该阶段英国多元文化教育与身份认同教育之间的关系,同时从培养身份认同角度简要分析英国中小学校多元文化教育面临的新时期挑战及其未来展望。本文梳理了英国多元文化的历史现状以及英国基础教育阶段多元文化教育的发展历程,将英国中小学多元文化教育与以培养英国国家认同感为目标的身份认同教育相联系比较。同时本文利用案例分析呈现
随着社会中不同类型问题风起泉涌,校园安全已经到了四面激化的程度。校园内时有发生的打架暴力、师生和其他人员的意外摔倒以及自杀轻生等诸多行为,都会对学生的精神以及身体的健康造成不可逆转的影响,会造成学生家长和社会的担忧,也会干扰甚至破坏学校正常教学进程、科研的正常进程以及学生和教职工们的正常生活秩序。以上种种情形都暴露出如今的学校安全管理工作还存在部分一触即发的问题,以及亟待解决的薄弱环节。当下信息化
新时代背景下的高中化学课程倡导教学应从社会发展和学生自身的需要出发,课程改革应凸显化学学科自身的特点与优势,激发学生的创新能力、创新意识和学习主动性,并强调培养学生的学科核心素养。STSE是科学、技术、社会、环境的英文首字母缩写,STSE教育强调化学教学应从四者的关联性出发,使学生在掌握知识和技能的过程中,提高分析和解决问题的能力,逐步培养学生的科学探究精神和社会责任意识。本研究主要围绕在《化学反
随着经济与技术的发展,中国网民的规模日益增加且移动社交应用的使用率居高不下,Z世代人群(截止至2020年,11岁~25岁的人)已经成为移动社交的主要使用群体,社交应用的高使用率意味着巨大的市场价值,因此移动社交软件行业特别是校园社交软件领域迎来了新的机遇与挑战。面对多变的移动社交市场环境,若要使校园社交产品提高用户的感知价值、社会影响,实现较好地营销推广过程,那么准确的产品定位就显得十分重要。LW
随着信息信息时代到来,越来越多的数据趋向于电子化。医疗数据也不例外,逐渐趋向数字化。数字化发展对于医学领域是把双刃剑,既给患者和医生带来了便利,同时也为信息安全埋下隐患。医学图像是医生诊断的重要工具,不仅有着患者病情,也包含了患者个人隐私。因此,医学图像的私密性尤为重要,医学图像的安全性是信息化时代最重要的问题。为了解决信息泄露的问题,许多专家学者提出数字水印的方法。数字水印可以把患者的个人信息隐
近年来,随着互联网的普及和政府对“互联网+”的大力推进,许多教育企业纷纷开辟了线上市场,越来越多的在线学习平台走入大众视野中,取得了令人瞩目的商业成就。在线学习的形式也渐渐受到更多用户的青睐,在疫情期间更是以不可替代的优势迅速崛起。然而,由于信息过载问题,学习者很难在大量的学习资源中找到合适的课程。如何准确推荐适合学习者的学习资源成了横亘在相关企业面前的技术壁垒。目前已有许多学者提出了优秀的在线学
目标检测是计算机视觉领域的一个重要的分支,它的任务是在图像中确定需要检测的物体,通常使用一个矩形框在图片中框出物体的具体位置及大小,并判断物体类别进行输出。目前图像目标检测算法已经有许多极具代表性的算法。但是针对视频目标的检测算法却进展较为缓慢,视频数据虽然较图片数据来说,物体容易存在异常形变或遮挡等问题,但同时视频数据也含有比图片数据更多的时间序列信息。常见的目标检测算法可以分为两类,一类是双阶
随着信息和大数据时代的来临,许多领域发生了革命性的变化。医疗领域已经在朝着数据化和信息化方向发展。病人的电子病历(EPR)、医学影像等数据的出现极大地方便了医生同行之间的交流,促进了医学的发展。但是数据量的逐年激增使得医院和医疗机构更愿意把数据存储在第三方云平台。这些医疗数据在云平台上传输和存储的过程中,容易受到不法分子的攻击,造成病人隐私的泄露。当前国内外医疗数据隐私泄露问题频发,在医疗数据加速