【摘 要】
:
将强化学习引入到进化博弈中,建立了进化博弈中的多代理人强化学习模型,并基于Q-学习给出了算法流程,仿真算例的结果表明多代理人强化学习模型能使得博弈人不断学习、寻求最
【机 构】
:
武汉大学政治与公共管理学院; 武汉大学经济与管理学院; 武汉科技大学冶金工业过程系统科学实验室;
【基金项目】
:
国家自然科学基金(60574071,70533040)
论文部分内容阅读
将强化学习引入到进化博弈中,建立了进化博弈中的多代理人强化学习模型,并基于Q-学习给出了算法流程,仿真算例的结果表明多代理人强化学习模型能使得博弈人不断学习、寻求最优策略.
其他文献
“现代管理之父”彼得·德鲁克曾经说过,动荡时代最大的危险不是动荡本身,而是仍然用过去的逻辑做事。当下,不少酒店已经复工复产。然而,由于旅游市场尚未完全恢复,复工复产后的酒
<正> 随着土地使用制度改革和住房制度改革的推进,我国的城市房地产业得到了迅猛的发展,房地产市场逐渐发育形成。但与此同时,在房地产价格体系中居主导地位的商品房价格过高
在2016年2月2日国航股份西藏分公司年度工作会上,分公司党委提出建设“3650基层党委”的目标——着力把位于海拔3650米的分公司党委建设成为中航集团标准高、品质好、特色鲜明
工业循环冷却水中的钙离子含量测定是依据GB/T15452—2009标准——EDTA滴定法,在操作过程中发现,滴定至终点后,蓝色又很快返回紫红色,终点很难断定,通过对循环水中钙离子测定
随着广大人民群众对楼宇智能化中电气自动化需求的不断提高,楼宇的安防消防与通风照明等智能化系统的控制自动化水平,已经一跃成为了现代楼宇品质级别的关键衡量标准,同时,楼
老子在《老子》一书中首次提出了"道"的概念,并赋予它以形而上的意义。认为"道"是宇宙之最终依据,"道"生"有"和"无","无"是天地之始;"有"是万物之母,而"天下万物生于有,有生
本文通过研究知识管理产生的背景以及知识管理在企业中发挥的作用,进一步分析知识管理在长输油气管道建设业务管理现状和需求,阐述了知识管理在企业管理中的重要作用,提出了
<正>肠道检查前通常禁食8h,常会引起受检者低血糖、全身乏力、心慌、出汗等检查耐受性下降的情况,为此我们对肠镜检查前饮食对肠道准备的影响进行了观察,现报告如下。 一、
《简·爱》是著名英国作家夏洛蒂·勃朗特的经典作品,他的作品中塑造的女主人公的形象十分生动。在《简·爱》这部作品中,作者结合了自己的社会生活经验,使女主人公拥有了崇
文章讨论了现代汉语"才怪"的用法,主要从三个方面进行:一、分析了"才怪"句的语义,根据语义将"才怪"句分为两大类。"才怪1"表示"才奇怪"之义,在句子中做谓语。"才怪2"表示对某