【摘 要】
:
人工智能是当前非常火热的研究领域,国家也将人工智能教育列入规划中,其中感知和决策是人工智能中非常重要的环节。得益于深度学习的迅速发展,深度强化学习(DRL)逐渐成为了该
论文部分内容阅读
人工智能是当前非常火热的研究领域,国家也将人工智能教育列入规划中,其中感知和决策是人工智能中非常重要的环节。得益于深度学习的迅速发展,深度强化学习(DRL)逐渐成为了该环节中关键的方法。深度强化学习通过深度神经网络感知高维信息,提取关键特征,再利用强化学习对这些特征输入作出相应的决策动作,在与环境的不断交互中改善自己的动作策略,目前,深度强化学习逐渐在多个行业崭露头角。其中游戏行业由于样本获取成本低、速度快,已经成为检验强化学习算法的基准(比如Atari游戏系列)。本文目的在于利用DRL来协助生成游戏中非玩家角色(NPC)的智能行为策略(AI)。本文基于深度Q学习网络(DQN),根据NPC智能应用特点,针对性的改进了 DQN框架,主要内容和贡献点如下:1.将深度强化学习应用于游戏设计领域,尤其是NPC的.AI设计行业。通过输入敌我双方的状态信息,自动生成行为策略。一方面通过不断采样学习可以提高智能性,另一方面自动生成行为策略也大大提升效率。2.提出基于DQN的分布式DQN(DDQN)框架。将采样与学习解耦,算法与智能体解耦,多进程模式加速了游戏样本的采集与学习,对于实际应用有着重要意义。同时融合了优先级采样、模仿学习,对原始算法进行了改进与优化。3.提出基于DQN的分层DQN(H-ART-DQN)。通过先训练子网络学会一些子目标,再从高层大尺度时间范围进行目标选择,在加速训练的同时,也可以生成不同风格行为策略,能够满足游戏AI设计的需求。
其他文献
习近平新时代国家安全战略思想是习近平新时代中国特色社会主义思想的重要内容。国家安全战略环境的深刻变化是习近平新时代国家安全战略思想形成的时代条件,当前我国正由大
采用水溶液共聚合方法合成了聚醚类高性能减水剂,对比研究了引发剂种类及其用量、原料摩尔比、反应后期的熟化时间等工艺参数对聚醚类减水剂分散性的影响,从而优化了最佳的合
片剂生产中一个不容忽视的问题孟凡生金丽萍孙洁雨(内蒙古自治区卫生厅药品监督办公室呼和浩特010020)药品中的片剂产品其质量好坏至关重要。在药品监督检查工作中,发现有些药品
公共健康的目标是预防疾病和促进健康,它强调的是作为整体的人口的健康而非特殊个体的健康,因此公共健康需要在整体与个体之间进行取舍和权衡,于是便产生了整体功利与个体正
研究知识型员工心理契约对组织公民行为的影响,并且对比分析迁移和本地两种类型知识型员工的心理契约对组织行为的影响。实证结果表明:知识型员工交易型契约对组织公民行为的
太行山东麓南北狭长的山前丘陵平原上分布着许多大小冲积扇,海拔一般在100~200米之间,这里地势高敞,水源充足,黄土堆积较厚,与西边高耸贫瘠的太行山区和东边卑湿频涝的大平原相比,
Granger因果检验发现中国与美国的产业结构与科研投入表现出一致的规律性,研发强度的加大可以促进产业结构的高级化,而产业结构的变化却不是研发强度变化的原因;但是脉冲响应
莲雾(Syzygium samavangense Merr.et Perry)是桃金娘科蒲桃属植物,又名辈雾、琏雾、爪畦蒲桃、水蒲桃等,属热带常绿乔木。原产马来西亚、印度尼西亚和印度。目前国外以印度
随着时代经济的不断发展,市场对于机械类人才的需求量不断增大。本文从我国中职学校机械基础教学基本都是以理论教学为主较少进行实训教学的现状出发,对中职机械基础实训教学
在新课标的指引下,很多英语课堂形式多样,精彩纷呈。但某些精彩的课,透过其浮华的表象,究其实质,苍白而贫乏,不仅流失了语言学习的本质,更削弱了学生作为主体人的存在。本文