【摘 要】
:
伴随着计算机技术的高速发展,人工智能技术在生活中的各个方面都有了越来越多的应用,智能体视觉导航也成为了研究热点。但目前视觉导航用到的深度强化学习技术所面临的难收敛、低泛化和稳定性差等问题,仍未得到很好的解决,通过研究发现作为机器学习方法之一的迁移学习所具有的特性恰好可以提高导航的迁移性,因此将迁移学习运用到视觉导航中将会是提高导航效率的有效方法。随着导航的继续发展,导航的运用必然更为广泛,因此,进
论文部分内容阅读
伴随着计算机技术的高速发展,人工智能技术在生活中的各个方面都有了越来越多的应用,智能体视觉导航也成为了研究热点。但目前视觉导航用到的深度强化学习技术所面临的难收敛、低泛化和稳定性差等问题,仍未得到很好的解决,通过研究发现作为机器学习方法之一的迁移学习所具有的特性恰好可以提高导航的迁移性,因此将迁移学习运用到视觉导航中将会是提高导航效率的有效方法。随着导航的继续发展,导航的运用必然更为广泛,因此,进行导航迁移方法的相关研究,符合实际需求,具有重大的研究意义。本文围绕迁移学习在自适应视觉导航中的方法展开研究,并针对不同复杂程度的虚拟环境引入了不同的迁移学习方法,使智能体能够在面对新环境或新目标时快速完成指定任务。通过分析迁移学习在视觉导航中的国内外研究现状和迁移学习在视觉导航中的应用,本文提出了新的导航迁移学习方法,主要工作如下:1.针对简单的无家具室内虚拟导航环境,本文提出一种基于注意力机制的导航迁移方法,实现智能体在不同虚拟环境中的快速迁移导航。首先,为了对提取的特征进行筛选,突出不同特征的重要程度,重新分配每个区域的特征权重,对已有的迁移模型进行了改进,引入了注意力机制网络。然后,根据智能体观察的图像提取图像特征,生成辅助信息,再通过Actor-Critic网络制定策略,执行动作,并根据策略梯度理论,讨论了加入注意力机制网络后的损失函数。最后,在Vi ZDoom中构建了多个室内虚拟环境,在虚拟环境中评估了我们的模型,做了对比实验。实验结果表明,基于注意力机制的指导式导航迁移方法具有更快的收敛速度,并且在新环境中实现快速迁移。2.针对复杂的有家具室内虚拟导航环境,本文提出一种基于深度关联对齐的导航迁移学习方法。模型中除当前的状态信息外还增加了目标图像作为辅助信息,通过网络层提取图片特征,引入了深度关联对齐损失,对源域和目标域进行线性变换来将它们各自的二阶统计量对齐,平衡数据域和源域之间的深度特征。然后,将结合的信息输入到异步优势Actor-Critic框架中,智能体根据当前状态和视觉图像做出决策,并在设计损失函数时,设置了参数约束来限制深度关联对齐的工作,进而对原始的网络模型进行影响。最后,在复杂虚拟环境中进行实验,并设计对比实验,验证了我们的迁移方法可以更好的实现快速迁移。
其他文献
粒子物理学标准模型(SM)自20世纪60年代末期建立以来在长达40年的实验检验之下,已被证实是一个极其精确的理论。标准模型描述所有已知基本粒子的相互作用,包括物质粒子(三代夸克和轻子)、传递电弱强三种相互作用的规范玻色子、以及产生所有基本粒子质量的Higgs玻色子。然而标准模型仍然遭受一系列基本的理论疑难(例如,无法描述引力作用、精细调节问题、平庸性问题、真空稳定性问题、太多任意参数问题等等),使
近年来,随着人工智能的高速发展,各种智能应用和设备广泛出现,一些传统的生产生活方式被替代,但随之带来的是人工智能安全问题。造假图像和音频的出现、对抗性样本攻击的出现,都对人工智能系统产生巨大的威胁。可信AI,作为目前被广泛关注的研究热点,通过各种防御和容错技术,使得人工智能系统不再轻易被攻击。本论文针对语音方面的攻击手段提出相应的容错方法,提高语音识别系统的鲁棒性。目前语音攻击方法主要有三种,语音
社会对于智能视觉技术的需求越来越强,也推动了计算机视觉技术的高速发展,高速发展的视觉技术也在反哺社会,新时代的社会发展离不开计算机视觉技术。目标检测是计算机视觉技术的一个分支,其已经应用在工业、医学、交通、安全、军事等各个领域,取得了良好的效果。其能够使社会生活更加便利,能够帮助各行各业处理各种视觉任务,节约成本。当前目标检测领域的研究重点集中在提高目标检测技术的检测精度,检测速度以及更简易的部署
随着无线通信技术和人工智能的发展,基于WiFi的室内人员感知已经成为了炙手可热的研究对象。其中活动识别和手势识别应用广泛。由于WiFi信号具有覆盖范围广、普及性高等优点,且其物理层信道状态信息(CSI)对人们的活动和手势感知较为敏感,适合用于室内的人员感知任务。但是WiFi信号存在不稳定、受环境变化影响大的缺陷,从而制约了无线感知的进一步发展和实际应用。因此本文针对环境对无线信号的影响,从应对环境
互联网技术的发展导致网络视频数量激增,也带来了对更可靠、高效的视频处理技术的巨大需求。其中,行为识别作为视频处理的核心任务,受到了越来越大的关注。行为识别算法的性能关键在于对视频空间信息和运动信息的建模能力,然而,目前的行为识别模型往往难以对具有显著变化的复杂时序结构进行建模,从而导致模型的运动信息建模能力不足。因此,研究行为识别模型中的运动信息建模方案具有重要意义。基于上述原因,本文提出了一个基
自然语言处理(NLP)作为人工智能领域的重要分支,其研究的方向十分多。其中生成式任务更是当下的研究热点,因为生成式任务更具挑战性,它主要包括自动文本摘要和机器翻译两个子任务。自动文本摘要即机器从给定的文本中提取整个文本的关键内容。自动文本摘要可以极大地提升人们从海量数据中获取关键信息的效率,除此自动文本摘要还具备为短新闻文本生成标题的用途。当下基于神经网络设计的文本摘要模型都用到了多层编码器,而源
本论文主要研究平均曲率流的自相似解的性质和逆平均曲率流在几何中的应用。欧氏空间中的子流形XMn-Rn+p称为是self-shrinker,如果其平均曲率向量H和位置向量X满足方程其中上表示在法空间上的投影。Self-shrinker不仅源于平均曲率流的自相似解,也描述了平均曲率流的奇点模型,在平均曲率流的研究中有重要地位。本论文第3,4,5章将研究self-shrinker的性质。我们首先证明了任
随着中国经济的发展,城镇化进程的不断加快,为了进一步提高城市交通系统的运输效率,智能交通系统应运而生。为了解决在封闭道路场景下的交通拥堵问题和城市道路场景下的小目标检测和识别问题,本文做了大量理论论证和推导,并提出了相应的方案用来解决不同场景存在的问题。针对封闭道路场景下的智能交通系统,主要需要解决在运行过程中的交通流量不稳定性问题。现有的交通流量控制模型主要针对理想情况下的交通流量进行控制。因而
多项式系统所有孤立解的计算在工程和科学上有着广泛的应用。同伦连续方法近20年来已经成为求解多项式系统全部孤立解的一种可靠而有效的数值算法。由于曲线跟踪的算法和技巧已经比较完善,所以减少跟踪解曲线的数目成为进一步改进这一方法的关键。齐次同伦方法给出了方程组解的个数一个比较紧的上界。在计算上界的过程中遇到了两个问题,这两个问题计算的复杂度本质上都是指数量级的。一是在所有可能的分组中找到相应的m-齐次B
随着智慧城市建设的发展以及安防摄像头的广泛部署,社会公共安全需求日益增加,人工的视频监控方式已经不能满足需要,利用计算机视觉技术对视频数据进行分析成为了新的研究热点。基于监控视频的人体行为识别技术作为计算机视觉领域的一个基本任务,包括视频中的人体检测,人体姿态估计,人体跟踪以及对时间序列数据的分析与理解等问题。其难点主要在于人体动作的多样性导致行为类别难以定义,数据集难以收集。其次,监控系统中的视