【摘 要】
:
运动目标的检测也就是人们常说的追踪问题,它是计算机视觉的重要组成部分。其相关的方法有很多种,其中光流法描述的是图像中像素点灰度值的变化趋势,也就是像素点的运动速度矢量场。在过去的几年中,深度学习在计算机视觉和自然语言处理等各种问题上都取得了很好的效果。而随着卷积神经网络的理论逐渐成熟,其相关研究逐渐深入到光流特征图评估的领域。本文提出了一种称为快速光流单元的网络子结构,它使原网络能够通过一种快速并
论文部分内容阅读
运动目标的检测也就是人们常说的追踪问题,它是计算机视觉的重要组成部分。其相关的方法有很多种,其中光流法描述的是图像中像素点灰度值的变化趋势,也就是像素点的运动速度矢量场。在过去的几年中,深度学习在计算机视觉和自然语言处理等各种问题上都取得了很好的效果。而随着卷积神经网络的理论逐渐成熟,其相关研究逐渐深入到光流特征图评估的领域。本文提出了一种称为快速光流单元的网络子结构,它使原网络能够通过一种快速并且有鲁棒性的方法来评估光流从而生成特征图。本文提出的快速光流单元方法是以FlowNetC为改进对象,原FlowNetC具有开创性的利用卷积神经网络进行端到端地对光流评估任务进行学习。本文利用光流本身的性质提出的快速光流单元可以利用光流思想引导网络评估光流,增强网络对不同运动趋势产生光流的适应性。并且为了进一步节省计算时间,本文提出了Extend Sobel算子来减少使用Sobel算子提取空间信息后需要二次融合的时间。同时,为了综合利用空间和时间信息,本文讨论了两种时空信息融合结构,分别是FUOF-Sum和FUOF-Concat。本文的想法得到了MPI Sintel和Flying Chairs数据集实验结果的证实。根据本文的研究结果,具有快速光流单元的FlowNetC可以在准确性、运行速度和鲁棒性方面拥有很强的竞争优势。并且本文与先进的轻量级光流评估网络LiteFlowNet也进行了结果对比,在准确性上用本文提出的快速光流单元改进的FlowNetC效果更加精准。
其他文献
知识图谱是由实体和关系组成的有向图,图中的节点表示现实世界中的各种事物实体,图中的边表示这些事物实体之间的相互关系。但是知识图谱通常都是不完全的,会有大量的关系缺失,通过人工的方式补全这些缺失的关系,需要消耗大量的人力和时间。因此,知识表示学习被提出来,通过将实体嵌入到连续的低维向量空间中,进而实现知识图谱的自动补全。Trans E模型是谷歌提出来的第一个基于翻译的知识表示模型,它是后续所有基于翻
在经典机器学习问题中,多标记学习作为一个热门的研究内容对现实世界多义性对象的研究具有重要意义,然而在现有的多标记学习算法中都忽略了标签之间具有的不平衡性。很多时候,研究者们更关心实例对于不同标签的隶属度以及其分布情况,因此有研究将多标记数据中的逻辑标记替换成了概率分布的形式,这就得到了标记分布数据。不论是多标记数据还是标记分布数据,都面临着数据规模爆炸式增长的问题。时至今日,针对多标记数据的特征选
近年来,随着互联网技术的蓬勃发展以及文本信息的爆炸式增长,“信息过载”问题愈发严重。如何快速准确地从大量无结构的信息中抽取出用户感兴趣的信息成为当前自然语言处理领域的热点问题。因此,信息抽取技术受到的关注逐年增加。作为信息抽取中的重要子任务,事件抽取旨在从自然语言文本中抽取出指定的事件信息,并以结构化的形式存入数据库中。事件抽取任务分为两个子任务:事件检测和事件论元抽取,本课题主要聚焦于第一个子任
信度分配技术涉及确定系统组件对系统整体性能的贡献,强化学习的成功离不开信度分配技术。在多智能体强化学习领域信度分配主要是合作式环境下各智能体对全局奖励信号的分配。通过研究信度分配机制,来完善或解决合作式多智能体深度强化学习下单个智能体策略更新信号不准确的问题,从而达到提高多智能体学习效率和协作程度的目的。因此,多智能体信度分配是解决合作式多智能体协调问题的关键。然而,一方面之前的研究大多基于差异奖
目标检测是计算机视觉中常见而具有挑战性的任务,传统的目标检测分为滑窗提取候选区域,提取相关特征和对特征分类三个过程。该方法存在的缺陷有滑窗时间复杂和窗口冗余,除此之外,手动设计的特征在目标多样性上没有很好的鲁棒性。深度学习技术不断发展,目标候选区域和相关特征可以通过卷积神经网络来提取,目标检测任务变成端对端的形式。深度学习的检测算法在速度和准确性上有了很大提升。天文学领域中,检测日冕暗化(Coro
数字图像作为信息的重要载体之一,在人们的日常生活、娱乐和工作中发挥着至关重要的作用。伴随着数字图像的广泛传播,人们对数字图像进行修改的需求愈加迫切,由此出现了各种图像编辑软件,如Photoshop、美图秀秀等。尽管这些图像编辑软件给人们带来了极大的便利,但是也给了不法分子可乘之机。如果这些虚假图像被用于媒体、科研、司法等领域,势必会引起恶劣的影响。因此,数字图像取证引起了研究人员的广泛关注。图像彩
三维人脸的有效表示以及重建在计算机视觉和图形学有着广泛的应用。三维人脸的表示,即是通过一定的算法得到三维人脸的高维特征数据,重建就是从高维特征数据中能够通过算法模型重建出对应的三维人脸。大多数存在的线性表示算法并不能有效的重建出高质量的三维人脸数据,尤其是对于面部细节的处理比较粗糙,而最新的非线性表示方法不太适用于实际三维形状。三维人脸的表示和重建能够给人脸识别、机器情感表达等方向提供该技术支持,
深度学习技术在近些年来发展迅速,而使用深度学习技术开发的系统在各个领域被广泛应用并表现出优秀的能力。但是深度学习系统中可能存在一些缺陷,这些缺陷会使深度学习系统在某些输入下作出错误决策,导致严重后果。因此,深度学习系统的测试受到越来越多的关注。深度学习系统可被分为深度学习模型和深度学习库两部分,目前大部分深度学习测试的研究针对的是深度学习模型,很少有研究针对深度学习库进行测试。由于深度学习库被众多
近年来,深度神经网络取得了突破性的进展,如今在生活中的各个领域都得到了广泛的应用,比如图像分类识别、人脸识别、语音识别等。随着对网络结构和损失函数的不断优化,深度神经网络显著的改善了各种复杂的分类任务的性能。损失函数是深度学习中不可或缺的一部分,而对于不同的任务,有各种各样的损失函数,如MSE,BCE等。关于损失函数的性能有很多研究。一个好的损失函数理论上应该能够使得数据集中相同类别的特征的分布更
基于竞争抑制免疫层析原理,开展茶叶中草甘膦快速检测试纸条的研制。采用柠檬酸三钠还原氯金酸制备了20 nm胶体金颗粒,然后以胶体金为标记物制备草甘膦单克隆抗体-胶体金偶联物,以硝酸纤维素膜为固相载体,包被草甘膦半抗原-卵清蛋白偶联物为检测线、羊抗兔二抗为质控线,建立草甘膦的胶体金快速检测试纸条。同时优化了胶体金最适pH值、抗体最佳使用量、试纸条材料的型号,最终确定胶体金溶液的pH值为7.5,最佳抗体