基于仿生学习的机器人未知环境探索的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：wuqianlan987654

【摘要】

：

理解和模拟人和动物神经系统内在的学习和组织机制，并将这种机制赋予机器，是控制科学、人工智能和机器人学研究的重要课题。机器人未知环境探索广泛应用于外星球探索、军事侦察

【作者】

：

周路

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2013年期

【关键词】

：

智能机器人未知环境探索仿生学习强化学习操作条件反射路径规划

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

理解和模拟人和动物神经系统内在的学习和组织机制，并将这种机制赋予机器，是控制科学、人工智能和机器人学研究的重要课题。机器人未知环境探索广泛应用于外星球探索、军事侦察、灾难搜救等领域。如何提高机器人的自主探索能力以及对环境的适应性是机器人未知环境探索的研究热点之一。　　本文从仿生学习的角度出发，围绕移动机器人在未知环境下的自主探索问题展开研究，主要进行以下研究工作:　　(1)将强化学习方法应用于机器人未知环境探索中，实现了未知环境探索的Q学习算法，完成了算法各模块的设计，并基于Mobotsim的仿真环境，完成了机器人未知环境探索仿真实现;提出了一种Q值更新算法以加快学习速度并进行了相关的仿真实验研究以验证算法的可行性。　　(2)为使机器人模拟生物的学习过程，基于操作条件反射思想构建了一种具有情感因子的操作条件反射自动机OCAE(Operant Condition Automata with Emotion)，OCAE利用生物取向性原理，依赖取向性函数获得行为概率变化的趋向，依照概率分布，自主选择行为，从而使学习系统的自适应性得到提高;OCAE具有的情感模块能够模拟生物的内心情绪状态，利用情感函数对行为概率进行二次学习，通过二次学习可以进一步扩大行为概率的改变，有效加快学习进程。证明了OCAE算法的收敛性，完成了未知环境探索OCAE算法的设计，程序编写。仿真结果表明，OCAE不仅能完成环境探索任务，在机器人或目标位置状态改变时，比Q学习具有更好的适应性。　　(3)离散输入状态的OCAE，在不规则障碍物环境中行为易震荡，并且容易陷入局部极小。为解决这些问题，以OCAE为基础，构建了连续状态操作条件反射自动机COCAE(Continuous state Operant Condition Automata with Emotion),COCAE采用高斯函数对连续状态模糊化，结果作为模糊状态集合，用模糊“状态-操作”映射作为模糊规则，通过取向积累和变化函数对模糊“状态-操作”映射规则中的概率进行调整，输出确定的操作值;同时设计了取向值积累和变化函数来取代OCAE中的取向值函数，并对OCAE中的情感状态函数进行改进。完成了未知环境探索实验算法设计。通过仿真证明了连续状态操作条件反射自动机具有行为学习能力以及自主进化能力。和OCAE相比适应不规则障碍物环境，能克服局部极小，逼近全局最优。

其他文献

直接转矩控制系统低速性能的研究

该文首先讨论了感应电机直接转矩控制系统低速运行时存在的题,以及相应的各种解决方法,并在此基础上分析了定子磁链观测模型对系统低速性能的影响,提出了一种适合于整个调速

学位

直接转矩控制模糊控制低速性能

复杂环境下人群流量监控关键技术研究

近年来，大型公共场所的人群活动愈来愈频繁，合理管理大规模人群活动具有深远的研究意义。智能人群监控系统能够实现全天候的人群管理，减少公共场所的安全隐患。本文旨在研究复杂

学位

复杂环境人群流量监控系统行人计数CASIA数据库数据采集

一类具有长时延网络的预测控制方法研究

浅海油气田地处浅海滩涂,环境恶劣,油气井的操作控制需要技术人员现场操作,安全性低,实时性差。针对这些问题,建设油田自动化系统,以实现油田自动化生产。针对建设油田自动化

学位

网络控制系统长时延时延补偿广义预测控制

过程控制系统中异常数据检测方法的研究

随着现代工业的飞速发展,流程工业对过程控制系统的控制精度、响应速度、稳定性等提出了更高的要求,对过程的建模也越来越多,越来越复杂。然而大多数的建模方法往往都依赖于

学位

过程控制系统异常数据检测小波变换电弧炉

不等长间歇过程的统计建模及在线监测

近年来,随着现代社会对多品种、多规格和高质量产品的迫切需求,生产小批量、高附加值产品的间歇过程己成为工业中一种重要的生产方式,被广泛应用于食品、精细化工、生物制药

学位

间歇过程不等长数据多时段动态时间弯曲多元统计在线监测

恶劣条件下GPS的RAIM算法研究

随着GPS在民用航空领域的广泛应用，航空导航高精度、高安全性和高可靠性的特殊需要对导航系统的完好性监测能力提出了很高要求，加强对GPS完好性监测技术研究，及时有效的检测和识

学位

GPS完好性监测改进RAIMGPS/INS紧组合导航辅助RAIM

基于智能体协调策略的分布式预测控制问题研究

随着计算机网络的迅速发展,控制已不再局限于集中式控制,更多采用的是分布式控制,同时预测控制作为一种先进的过程控制方法已被广泛地应用在各种工业过程中。实际系统中大量

学位

模型预测控制分布式控制终端约束多智能体

工业锅炉微型计算机控制系统设计

该论文通过分析典型的工业锅炉-SZS50-1.5T/250-Y油炉的运行特点,以及水位系统和燃烧系统的特性,设计了利用高质量计算机构成集散控制系统(DCS)进行锅炉微机的自动检测和自

学位

工业锅炉计算机自动控制

统计参数语音合成中语音参数化方法研究

统计参数语音合成方法近年来吸引了越来越多研究者的关注，特别是基于隐马尔可夫模型(Hidden Markov Model，HMM)的语音合成方法。该合成方法具有输出语音平滑连贯、语音参数灵活

学位

语音合成隐马尔可夫模型激励模型语音分析合成模型参数生成算法

污水处理过程污泥膨胀预测方法研究

污水处理厂作为水污染防治体系的核心，扮演着十分重要的角色，减少污水处理厂异常工况特别是严重异常工况的发生，保证其持续稳定的运行，对环境保护和水资源可持续利用都有着重要意

学位

污水处理污泥膨胀粗糙集灰色模型专家系统

基于仿生学习的机器人未知环境探索的研究

其他学术论文