自治移动机器人基于操作条件反射及内发动机的认知行为研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:hanmark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然生命的诸多行为和技能是在生物个体的生长发育过程中逐渐形成和发展起来的。自然生命行为或技能的形成过程是一个认知和发育的过程。赋予机器人这种类似于自然生命认知和发育机制,是认知科学、人工智能和机器人学研究的重要课题。本文旨在研究自治移动机器人及其认知发育机制,在学习自动机理论的框架中,建立描述机器人认知发育机制的自动机模型,通过计算机的模拟和仿真,理解生物系统的认知行为,并使机器人系统能够像生物系统那样,在自治地与环境交互作用的过程中,通过自我认知和自身发育,自组织地发展其运动控制技能。  本文基于操作条件反射理论以及有关内发动机的理论,研究自治移动机器人的认知行为,主要研究工作如下:  (1)自治操作条件反射自动机  为模拟生物行为认知过程的特征,本文基于操作条件反射理论提出一种自治操作条件反射自动机(AutonomousOperantConditioningAutomata,AOCA)。AOCA涉及一种描述自治式自动机器的离散计算模型,主要包括:操作集合、状态集合、“条件—操作”规则集合、可观测的状态转移,以及操作条件反射学习律。定义了基于AOCA状态取向值的行为熵,规定了AOCA的递归运行程序。AOCA的重要特征在于模拟生物的操作条件反射机制,因而具有仿生的自组织功能,包括自学习和自适应功能,可用于描述、模拟、设计各种自组织系统,特别地,可将其应用于描述、模拟、设计机器人系统的各种智能行为。本文对AOCA进行了理论分析,从理论上证明了AOCA的操作条件反射学习机制的收敛性,即:最优操作出现的概率随认知学习进程趋于1,操作熵随认知进程收敛至极小。  (2)基于取向性的内发动机系统  操作条件反射需要外部环境或人为给出评价,而生物的很多行为并不需要外界的推动就能自发形成,这些行为的动机与内在的目标和目的相关联,而不仅仅是外在激励或惩罚措施的结果。内发动机(IntrinsicMotivation,IM)是发育心理学中的一个重要概念,也是人类开放式认知发育至关重要的机制,推动人类去探索、操纵或探查环境,培养好奇心并参与到有趣的新活动中。它是感觉运动和认知发育过程最重要的,激发个体的学习活动,引发其对达到学习目标的心理预期。为了更好的模仿人或动物的认知行为,本文设计一种基于取向性的内发动机系统(Tropism-basedIntrinsicMotivation,T-IM),涉及有限状态及其转移机制的内部模型、“感知—行动”机制的内部模型、学习进程的评价,并以桌面六足机器人作为具体研究对象,建立桌面六足机器人的内发动机系统,再现Wiener在其《控制论》中所设想的机器蠕虫,实现其负趋光行为的认知能力,使得机器人具有类似人或动物的运动控制技能,特别是这种技能的形成和发展能力。  (3)基于内发动机的操作条件反射自动机  有些认知行为的产生不仅与外部环境或人为给出的评价相关联,即与操作条件反射相关联,而且可能是自发形成,这与内发动机相关联。为了更好地模仿生物完善和体现生物认知的渐进过程,本文结合内发动机机制,在AOCA的基础之上建立一种基于内发动机的操作条件反射自动机(IntrinsicMotivation-basedOperantConditioningAutomata,IM-OCA)。IM-OCA主要包含:内部状态集合、感知符号集合、操作符号集合、状态转移机制、“感知—行动”机制、取向核、指导自主认知方向以及认知核。本文对基于内发动机的操作条件反射自动机的收敛性进行了分析,并从理论上证明了其收敛性。将IM-OCA应用于桌面六足机器人的负趋光行为认知研究,初始阶段机器人行为是不确定的,可能趋光也可能负趋光;随着认知学习的进行,机器人趋光行为的概率逐渐减少,负趋光行为的概率逐渐增加,并最终负趋光行为的概率接近于1。IM-OCA可以在线学习,通过自治地与环境进行交互,提高系统的认知学习速度和精度。  本文的研究工作得到了国家自然科学基金资助项目(61075110)、北京市自然科学基金资助项目(4102011)、高等学校博士学科点专项科研基金资助课题(No.20101103110007)、国家自然科学基金项目(60774077)、国家“863计划”资助项目(2007AA04Z226)和北京市教委科研计划重点项目(KZ200810005002)的支持。研究成果为机器人的认知发育,特别是机器人心智的发育,提供了新思路和新途径;对于机器人学和机器人技术、控制科学、人工智能和机器学习等诸多领域均有参考价值和意义。
其他文献
该文在对Box—Jenkins时间序列方研究和分析的基础上提出了基于人工神经网络的预测模型,并开发了负荷估算的神经网络软件系统.文中针对BP神经网络结构和算法的某些不足之处提
基于计算机视觉的视觉测量技术,由于其具有非接触、实时、在线、精度高等特点,近年来得到了迅速的发展和广泛的应用。而双目视觉的测量技术,由于其在系统结构简单性及灵活性
"计算机集成制造系统(CIMS)"是实现企业各部分集成、提高企业生产效率与竞争力的重要手段.其中,信息集成是CIMS的关键,是功能集成与其他集成(网络等硬件集成除外)的基础.由于
"渗碳处理"是汽车齿轮加工过程中的一道关键工序.该文针对某厂的料盘推送式无罐连续渗碳生产线进行了控制及管理系统的设计.该文还针对被控对象的特点进行了控制方案研究,最
该论文根据该校教学管理的实际需要,通过对教学管理信息系统(IMIS)的研究,全面 地介绍了系统方案设计、整体结构、功能特性与技术实现等方面的内容.在方案的设计过程中,融入
该文基于面向对象的分析设计方法,应用软件工程的概念和原理,从软件工程的角度,对连锁超市业务流程、数据流程、硬件结构、软件结构、软件实现的关键性技术的问题进行了研究,
该文首先对广义系统的基本概念、基本理论做了介绍,接着重点讨论了广义系统的输 出稳定问题和广义系统能量有限的有限制调节器问题.该文是利用几何方法对这两类问题进行探讨
电弧炉是炼钢工艺的重要设备,短网一般指的是从变压器二次侧出线端到电极(包括电极)的载流体的总称。由于短网是大电流网络,在冶炼时电流一般可以达到上万安培甚至是十万安培
该文采用系统工程的作分析方法,即围绕系统的整体性、有序性和动态性来分析风险投资,该文首先将风险投资与一般性金融投资作了比较,指出了风险投资的实质、特征、运作机理及
随着社会的进步和公路交通系统的飞速发展,交通安全已成为越来越重要的社会问题。因此智能交通系统(Intelligent Transpoit System,简称ITS)得到了广泛关注和研究。作为智能交