论文部分内容阅读
自然生命的诸多行为和技能是在生物个体的生长发育过程中逐渐形成和发展起来的。自然生命行为或技能的形成过程是一个认知和发育的过程。赋予机器人这种类似于自然生命认知和发育机制,是认知科学、人工智能和机器人学研究的重要课题。本文旨在研究自治移动机器人及其认知发育机制,在学习自动机理论的框架中,建立描述机器人认知发育机制的自动机模型,通过计算机的模拟和仿真,理解生物系统的认知行为,并使机器人系统能够像生物系统那样,在自治地与环境交互作用的过程中,通过自我认知和自身发育,自组织地发展其运动控制技能。 本文基于操作条件反射理论以及有关内发动机的理论,研究自治移动机器人的认知行为,主要研究工作如下: (1)自治操作条件反射自动机 为模拟生物行为认知过程的特征,本文基于操作条件反射理论提出一种自治操作条件反射自动机(AutonomousOperantConditioningAutomata,AOCA)。AOCA涉及一种描述自治式自动机器的离散计算模型,主要包括:操作集合、状态集合、“条件—操作”规则集合、可观测的状态转移,以及操作条件反射学习律。定义了基于AOCA状态取向值的行为熵,规定了AOCA的递归运行程序。AOCA的重要特征在于模拟生物的操作条件反射机制,因而具有仿生的自组织功能,包括自学习和自适应功能,可用于描述、模拟、设计各种自组织系统,特别地,可将其应用于描述、模拟、设计机器人系统的各种智能行为。本文对AOCA进行了理论分析,从理论上证明了AOCA的操作条件反射学习机制的收敛性,即:最优操作出现的概率随认知学习进程趋于1,操作熵随认知进程收敛至极小。 (2)基于取向性的内发动机系统 操作条件反射需要外部环境或人为给出评价,而生物的很多行为并不需要外界的推动就能自发形成,这些行为的动机与内在的目标和目的相关联,而不仅仅是外在激励或惩罚措施的结果。内发动机(IntrinsicMotivation,IM)是发育心理学中的一个重要概念,也是人类开放式认知发育至关重要的机制,推动人类去探索、操纵或探查环境,培养好奇心并参与到有趣的新活动中。它是感觉运动和认知发育过程最重要的,激发个体的学习活动,引发其对达到学习目标的心理预期。为了更好的模仿人或动物的认知行为,本文设计一种基于取向性的内发动机系统(Tropism-basedIntrinsicMotivation,T-IM),涉及有限状态及其转移机制的内部模型、“感知—行动”机制的内部模型、学习进程的评价,并以桌面六足机器人作为具体研究对象,建立桌面六足机器人的内发动机系统,再现Wiener在其《控制论》中所设想的机器蠕虫,实现其负趋光行为的认知能力,使得机器人具有类似人或动物的运动控制技能,特别是这种技能的形成和发展能力。 (3)基于内发动机的操作条件反射自动机 有些认知行为的产生不仅与外部环境或人为给出的评价相关联,即与操作条件反射相关联,而且可能是自发形成,这与内发动机相关联。为了更好地模仿生物完善和体现生物认知的渐进过程,本文结合内发动机机制,在AOCA的基础之上建立一种基于内发动机的操作条件反射自动机(IntrinsicMotivation-basedOperantConditioningAutomata,IM-OCA)。IM-OCA主要包含:内部状态集合、感知符号集合、操作符号集合、状态转移机制、“感知—行动”机制、取向核、指导自主认知方向以及认知核。本文对基于内发动机的操作条件反射自动机的收敛性进行了分析,并从理论上证明了其收敛性。将IM-OCA应用于桌面六足机器人的负趋光行为认知研究,初始阶段机器人行为是不确定的,可能趋光也可能负趋光;随着认知学习的进行,机器人趋光行为的概率逐渐减少,负趋光行为的概率逐渐增加,并最终负趋光行为的概率接近于1。IM-OCA可以在线学习,通过自治地与环境进行交互,提高系统的认知学习速度和精度。 本文的研究工作得到了国家自然科学基金资助项目(61075110)、北京市自然科学基金资助项目(4102011)、高等学校博士学科点专项科研基金资助课题(No.20101103110007)、国家自然科学基金项目(60774077)、国家“863计划”资助项目(2007AA04Z226)和北京市教委科研计划重点项目(KZ200810005002)的支持。研究成果为机器人的认知发育,特别是机器人心智的发育,提供了新思路和新途径;对于机器人学和机器人技术、控制科学、人工智能和机器学习等诸多领域均有参考价值和意义。