一种数据高效的第三人称模仿学习方法 - 论文文献免费下载 - 搜论网

一种数据高效的第三人称模仿学习方法

来源 :计算机科学 | 被引量 : 3次 | 上传用户：lllwan1

【摘要】

：

模仿学习提供了一种能够使智能体从专家示范中学习如何决策的框架。在学习过程中,智能体无需与专家进行交互,也不依赖于环境的奖励信号,而只需要大量的专家示范。经典的模仿学习方法需要使用第一人称的专家示范,该示范由一个状态序列以及对应的专家动作序列组成。但是,在现实生活中,专家示范通常以第三人称视频的形式存在。相比第一人称专家示范,第三人称示范的观察视角与智能体的存在差异,导致两者之间缺乏一一对应关系,因

【作者】

：

姜冲章宗长陈子璇朱佳成蒋俊鹏

【机构】

：

苏州大学计算机科学与技术学院,南京大学计算机软件新技术国家重点实验室

【出处】

：

计算机科学

【发表日期】

：

2021年02期

【关键词】

：

模仿学习第三人称领域特征数据高效图像差分变分判别器瓶颈 Imitation learning Third-person Domain feature

【基金项目】

：

国家自然科学基金面上项目(61876119),江苏省自然科学基金面上项目(BK20181432),中央高校基本科研业务费专项资金(14380005)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

模仿学习提供了一种能够使智能体从专家示范中学习如何决策的框架。在学习过程中,智能体无需与专家进行交互,也不依赖于环境的奖励信号,而只需要大量的专家示范。经典的模仿学习方法需要使用第一人称的专家示范,该示范由一个状态序列以及对应的专家动作序列组成。但是,在现实生活中,专家示范通常以第三人称视频的形式存在。相比第一人称专家示范,第三人称示范的观察视角与智能体的存在差异,导致两者之间缺乏一一对应关系,因此第三人称示范无法被直接用于模仿学习中。针对此问题,文中提出了一种数据高效的第三人称模仿学习方法。首先,

其他文献

爆破技术在岩土安全中的应用

爆破技术在破碎矿岩的主要手段之一，对坚硬矿岩甚至是唯一有效的手段。本文总结了作者近几年用爆破技术处理岩土安全的若干问题，包括：巷道维修，危岩处理，空场处理。

期刊

岩土安全爆破技术老道维修危岩处理空场处理ExplosionGeothenical safety

推行全员经营搞好法人治理实现市场的战略转移和企业的可持续发展

中国石油天然气华东勘察设计研究院，是全国百强设计院之一。机构重组合后，油田市场发生了极大变化。处境困难，走入低谷，新领导上任后，组织学习认清了形式，增强了市场意识，调整了经营

期刊

市场意识勘察设计单位经营战略企业发展

浅谈我国建设监理与国际接轨的问题

本文介绍了国外“工程咨询公司”、“工程管理公司”、“工程承包公司”的工作范围；建议我国监理工作应逐步与国防接轨，“全方位化”，即承担工程项目开工前的技术咨询，也承担施工

期刊

工程咨询工程承包建设监理国际接轨施工监理

低品位微细粒磁铁矿的综合回收

阐述了金堆城钼矿综合回收低品位微细粒磁铁矿的工艺过程及其特点，强调了作业控制的重要性，针对综合回收项目，分析了该类项目的特点。

期刊

磁铁矿低品位矿综合回收作业控制选矿MagnetiteLow grade oresComprehensive recoveryOperation

新型耐热合金

期刊

耐热合金化学成分加工性能镍基合金

胫腓骨骨折切开复位内固定术围手术期护理方法探讨

目的探讨胫腓骨骨折切开复位内固定术患者围手术期的护理方法及护理效果。方法选取我院接受治疗的68例胫腓骨骨折切开复位内固定术患者为本次研究对象,采用随机分配法,将68例

期刊

切开复位内固定术胫腓骨骨折护理

健康教育对颈椎骨折患者颈椎前路手术治疗效果的影响

目的分析健康教育对颈椎骨折患者颈椎前路手术治疗效果的影响。方法选取本院收治行颈椎前路手术的颈椎骨折患者作为观察对象,采取分层随机法将入选患者分为两组,每组50例。对

期刊

健康教育颈椎骨折颈椎前路手术

小水库网箱养殖鳜鱼技术研究初探

鳜鱼又名桂花鱼,隶属鲈形目、鳍科、鳜鱼属,由于生长速度快、肉味鲜美、肥而不腻、营养丰富,且有补虚劳、益脾胃之功效,是经济价值很高的名贵优质经济鱼类,被水产品市场誉称"

期刊

水产品市场淡水石斑鱼水库网箱养殖桂花鱼天然水域天然资源鳜鱼虚劳

调整创新钼业振兴

分析当前国际钼市场供大于求和价格疲软的形势,明确指出,当前和今后一段时间,国际钼市是熊市而不是牛市,要恢复牛市,需要时间和各方的共同努力.国内钼生产形势喜人,但其发展

期刊

价格矿山钼副产钼钼消费结构调整技术创新钼工业钼铁International molybdenum marketPricePrimary mo

在贯标中如何持续推进QC小组活动

<正> 一、开展QC小组活动是提高质量的好办法 1997年3月20日国家经贸委、财政部、中国科协、全国总工会、共青团中央,中质协(以下简称五会一部)以国经贸[1997]147号文下发了

期刊

标准贯标企业质量管理

其他学术论文