有限记忆下的演化博弈问题研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:gmzz2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纳什均衡很好地定义了一次性博弈情况下所有参与者的行为结果,但是在生物界和人类社会当中,一次性博弈情况下的结果很难精确描述参与者的动态行为;纳什均衡不能较好地解释由自私个体组成的群体中合作行为的涌现。于是来自不同领域的学者开始利用演化博弈的方法来研究和解释这一现象,并且在近几年来取得了非常多的成果。考虑到很多现实社会的问题,参与者所处的博弈环境是不确定的,他们获得的信息往往是不完全的,并且参与者并非完全理性的,这使得我们寻求另外的办法来讨论这些情况下参与者决策行为。基于记忆的学习行为是对参与者的一个自然假设,本文通过研究基于历史记忆的学习行为,展示了参与者的博弈动态行为以及研究了一些条件下合作的涌现。在囚徒困境模型中,参与者的记忆对演化的均衡状态起了重要的作用,学习机制能够促使参与者策略呈现特殊分布。在酒吧问题中,我们重新对酒吧博弈进行定义,通过设计学习方法,不仅仅有效地协调了参与者之间的冲突,而且在特定参数情况下最大化参与者的收益与酒吧的收益。利用学习的方法,我们考察了最近的热点课题:公共品博弈模型。研究了在参与者基于自身记忆和对环境的反应两种行为中,他们策略的演化以及均衡。通过对学习机制的分析,我们不仅仅得到合作保持存在的基本条件,而且在人口迁移的情形下找到了合作扩散的机制。
其他文献
随着机器人应用领域的不断拓展,多机器人系统以其柔性、并行性及鲁棒性等特性受到普遍重视,围捕作为代表性的多机器人任务以其天然的动态性和对抗性成为研究热点。本文主要针对
两轮自平衡机器人是轮式移动机器人中重要的一类仿生系统。而桌面型两轮机器人不仅在体积、成本上具备优势,而且它可以实现在大型两轮机器人上无法实现的控制算法,具有广泛的应
机器学习作为智能信息处理的代表性方法在近几十年中取得了飞跃式的发展。然而经典的监督学习需要大量人工标记的数据作为训练样本;由于标记样本往往代价高昂,从而大大提高了监
定位与导航策略是实现移动机器人自主导航的关键问题。本文以运行于室内环境的轮式移动机器人为研究对象,对视觉自定位与未知环境下导航策略两个子问题展开深入研究。本文的
学位
十多年来,短信服务在世界各国电信市场中得到巨大的发展。而手机短信发送量的增长伴随而来的就是日趋泛滥的垃圾短信。词特征数量多,维数大,需要进行特征选择,否则会严重影响
随着世界各国对海洋的深入探寻,海洋勘测设备也由海上逐步向海下发展,根据海水环境的独特性质,水下设备应具有自主沉浮的能力,才能对海洋进行立体式探测。本文立足于中小型水下设
水下仿生游动机器具有机动性好、推进效率高等优点,应用前景广阔。而两侧波动鳍推进型仿生游动机器是一类典型的水下仿生游动机器系统。本文针对两侧波动鳍推进型仿生游动机器
磁共振无线供电技术,是一项近年刚出现的利用磁耦合谐振线圈之间的共振来实现电能以无线方式高效率传输的技术。相对于其它无线供电技术,磁共振无线供电技术具有中等距离上几乎
移动服务机器人工作时不仅需要识别周围的物体,而且也需要辨识环境中的运动的行人,因此,物体识别与行人检测是服务机器人领域中的两个重要的研究问题。特征提取与表达则是物体识