基于仿生学习的机器人未知环境探索的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wuqianlan987654
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
理解和模拟人和动物神经系统内在的学习和组织机制,并将这种机制赋予机器,是控制科学、人工智能和机器人学研究的重要课题。机器人未知环境探索广泛应用于外星球探索、军事侦察、灾难搜救等领域。如何提高机器人的自主探索能力以及对环境的适应性是机器人未知环境探索的研究热点之一。  本文从仿生学习的角度出发,围绕移动机器人在未知环境下的自主探索问题展开研究,主要进行以下研究工作:  (1)将强化学习方法应用于机器人未知环境探索中,实现了未知环境探索的Q学习算法,完成了算法各模块的设计,并基于Mobotsim的仿真环境,完成了机器人未知环境探索仿真实现;提出了一种Q值更新算法以加快学习速度并进行了相关的仿真实验研究以验证算法的可行性。  (2)为使机器人模拟生物的学习过程,基于操作条件反射思想构建了一种具有情感因子的操作条件反射自动机OCAE(Operant Condition Automata with Emotion),OCAE利用生物取向性原理,依赖取向性函数获得行为概率变化的趋向,依照概率分布,自主选择行为,从而使学习系统的自适应性得到提高;OCAE具有的情感模块能够模拟生物的内心情绪状态,利用情感函数对行为概率进行二次学习,通过二次学习可以进一步扩大行为概率的改变,有效加快学习进程。证明了OCAE算法的收敛性,完成了未知环境探索OCAE算法的设计,程序编写。仿真结果表明,OCAE不仅能完成环境探索任务,在机器人或目标位置状态改变时,比Q学习具有更好的适应性。  (3)离散输入状态的OCAE,在不规则障碍物环境中行为易震荡,并且容易陷入局部极小。为解决这些问题,以OCAE为基础,构建了连续状态操作条件反射自动机COCAE(Continuous state Operant Condition Automata with Emotion),COCAE采用高斯函数对连续状态模糊化,结果作为模糊状态集合,用模糊“状态-操作”映射作为模糊规则,通过取向积累和变化函数对模糊“状态-操作”映射规则中的概率进行调整,输出确定的操作值;同时设计了取向值积累和变化函数来取代OCAE中的取向值函数,并对OCAE中的情感状态函数进行改进。完成了未知环境探索实验算法设计。通过仿真证明了连续状态操作条件反射自动机具有行为学习能力以及自主进化能力。和OCAE相比适应不规则障碍物环境,能克服局部极小,逼近全局最优。
其他文献
该文首先讨论了感应电机直接转矩控制系统低速运行时存在的题,以及相应的各种解决方法,并在此基础上分析了定子磁链观测模型对系统低速性能的影响,提出了一种适合于整个调速
近年来,大型公共场所的人群活动愈来愈频繁,合理管理大规模人群活动具有深远的研究意义。智能人群监控系统能够实现全天候的人群管理,减少公共场所的安全隐患。本文旨在研究复杂
浅海油气田地处浅海滩涂,环境恶劣,油气井的操作控制需要技术人员现场操作,安全性低,实时性差。针对这些问题,建设油田自动化系统,以实现油田自动化生产。针对建设油田自动化
随着现代工业的飞速发展,流程工业对过程控制系统的控制精度、响应速度、稳定性等提出了更高的要求,对过程的建模也越来越多,越来越复杂。然而大多数的建模方法往往都依赖于
近年来,随着现代社会对多品种、多规格和高质量产品的迫切需求,生产小批量、高附加值产品的间歇过程己成为工业中一种重要的生产方式,被广泛应用于食品、精细化工、生物制药
随着GPS在民用航空领域的广泛应用,航空导航高精度、高安全性和高可靠性的特殊需要对导航系统的完好性监测能力提出了很高要求,加强对GPS完好性监测技术研究,及时有效的检测和识
随着计算机网络的迅速发展,控制已不再局限于集中式控制,更多采用的是分布式控制,同时预测控制作为一种先进的过程控制方法已被广泛地应用在各种工业过程中。实际系统中大量
该论文通过分析典型的工业锅炉-SZS50-1.5T/250-Y油炉的运行特点,以及水位系统 和燃烧系统的特性,设计了利用高质量计算机构成集散控制系统(DCS)进行锅炉微机的自动 检测和自
统计参数语音合成方法近年来吸引了越来越多研究者的关注,特别是基于隐马尔可夫模型(Hidden Markov Model,HMM)的语音合成方法。该合成方法具有输出语音平滑连贯、语音参数灵活
污水处理厂作为水污染防治体系的核心,扮演着十分重要的角色,减少污水处理厂异常工况特别是严重异常工况的发生,保证其持续稳定的运行,对环境保护和水资源可持续利用都有着重要意