Game-Agents系统决策问题研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:ttt11121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以博弈论作为决策的基础,系统地研究了各种Agent决策技术.首先,该文研究了基于各种模型的Agent学习与决策技术,如基于影响图模型的决策,这种方法的一个特点,即Agent对于环境或其他Agent有相关状态信息的情况下,每个Agent可以建立和维护一个模型,并根据环境变化的信息通过学习对模型进行实时的更新,而后在该模型中进行推理和决策.Daphne Koller等将影响图扩展到多Agent影响图,并以此来表示博弈和发现均衡策略,该文进一步将其扩展,提出动态多Agent影响图的概念框架,以此可以方便有效地表示多阶段博弈.其次,该文同样基于博弈论,研究了将Q-learning算法扩展到多Agent系统的情形,这种方法适用于在Agent缺乏环境及其他Agent的信息的情况下,Agent可以根据一定的概率分布计算其可能的行为与得益,根据得益的多少进行预测性决策,而后根据环境变化的信息进行校验与调整.
其他文献
多维数据库是数据仓库系统的一个重要组成部分,对联机事务分析有着极为重要的作用,该文介绍了多维数据库模型的特点和设计方法,采用了数据存储/数据集市结构向多维数据库提供
异构数据库系统(Heterogeneous DataBase System)是数据库技术自身发展出现的结果,复杂的异构数据资源的安全管理是异构数据库联合使用的必然要求.目前异构数据库研究主要集
该文首先介绍了P2P技术的概况并将它与传统的Client/Server模式做了比较,显示出P2P技术在资源利用率、负载平衡等方面的优势和在管理、安全性等方面的不足. 然后对对等网络的
随着越来越多的个人和机构联入互连网,网络安全问题成了世界各地研究的焦点。为了解决这个问题,实现网络信息传输的保密性、完整性、身份认证等安全特征,我们着手对IPSec安全协
该文介绍了基于linux系统设计的加密文件系统(Encrypted Filesystem-EncFS).EncFS系统体系结构包含四个重要的实体:文件存储服务器、客户端、认证服务器和密钥托管服务器.Enc
该课题是二炮某研究所在进行导弹仿真系统研制过程中,需要涉及对大量的战场环境信息进行管理、查询和分析,由于目前国内外的GIS产品大部分都是通用性的产品,所以对于军事应用
该文主要研究无谱逆反卷积问题的各种算法,包括数学法、广义Fourier变换法、时域卷积法、广义Fourier变换法和时域卷积法的综合法、卷积核因式分解法,其中主要研究时域卷积法
对短信息业务进行用户行为分析的关键技术是短信息文本的自动分类技术.论文从语料库统计的路线出发,对短消息文本的自动分类技术进行了研究,其特点在于:采用向量空间模型对短
随着中央银行各个生产系统相继进行全国纵向集中,每天吐出海量交易数据,中央银行拥有大量数据;但是,由于数据横向分散在各个生产系统中,导致管理信息分散、决策知识缺失,中央银行
随着计算机技术、通信技术和控制技术的飞速发展,人民生活水平的提高,构造一种智能化的家居,使互联网进入人们的日常生活,已成为迫切的需求。家居网络是融合信息管理和信息控制的