actor-critic相关论文
多智能体系统是由多个智能体与环境交互组成的分布式决策系统,是分布式人工智能的一个重要研究方向,在复杂未知的现实社会具有广阔的......
目标跟踪是计算机视觉领域的重要研究方向之一,在视频监控、智能机器人、无人驾驶、医疗诊断等多领域有广泛的应用。近几十年来,尽......
随着我国经济的快速发展,社会的物流需求越来越多,但社会物流总费用占GDP的比例却始终高居不下。而运输费用在物流总费用中的占比......
学位
轴孔装配是手机生产测试装配领域的常见操作,目前通常还是由人工完成。轴孔自动装配任务仍然是最近几年的一大挑战。传统的方法是......
学位
符号回归是指在符号表达式空间内寻找能够描述给定数据集的表达式。Genetic Programming(GP)是处理符号回归问题最常用的算法。但G......
著名的物理学家费曼曾经说过:“What I can’t not create,I do not understand”。系统创造事物的能力在一定程度上表明了系统理......
强化学习在解决序列决策问题方面尤为突出,近年来取得了巨大的发展。针对多智能体强化学习中,智能体与环境进行交互学习时不可避免......

