基于深度强化学习的多策略协同决策系统研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cyscwbr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能(Artificial Intelligence,AI)研究迎来了新一波热潮,人工智能技术进入了一个崭新的阶段。以深度神经网络为代表的深度强化学习技术(Deep Reinforcement Learning,DRL)开始越来越多地被用于科学研究和实际生产。基于深度强化学习的人工智能决策系统在医疗、工业生产等领域具有巨大的应用前景。尽管如此,目前的研究工作仍存在一些问题,如深度学习模型训练效率低下和决策系统研究中没有充分考虑环境变化对模型性能影响的程度等。针对这些问题,本文提出了基于深度强化学习的多策略协同决策思想,希望提升决策模型的训练效率和在变化环境中的性能稳定性。本文的主要研究工作如下:1、结合目前的研究成果,阐述了深度强化学习的基本原理和研究进展,分析了常见深度强化学习算法的优劣势,指出了目前人工智能决策系统研究中的困难点。2、针对目前决策系统研究中存在的训练效率低下、决策环境变化对模型性能的影响考虑不足等问题,本文分别设计了机器决策模型和人工决策模型,并基于集成学习的思想提出了一种将人类决策思维和机器决策思维结合的多策略协同决策算法。3、在多策略协同决策的基础上,将多种深度学习模型与人工决策模型进行融合以提升决策模型的性能,实验结果显示采用卷积神经网络和残差网络结合的多策略协同决策模型明显优于仅使用卷积神经网络的模型。4、基于象棋场景设计并实现了一个人工智能决策系统,通过该系统对人工决策算法中的各项影响因素进行了性能测试和排序,给出了局面评价公式设计的理论依据。在此基础上,本文对多策略协同决策算法和传统的深度强化学习算法进行了性能对比,实验结果表明,多策略协同决策算法在模型训练速度、决策模型棋力、模型输出结果的误差以及模型对环境变化的适应能力四个方面都优于传统的仅基于神经网络的深度强化学习算法。
其他文献
像素单元微缩化可以提高LED显示屏的分辨率。但是,LED芯片尺寸和间距的微小化会导致固晶难度大大提升,连接材料必须具备超细间距连接能力,才能保证固晶工艺的顺利进行。各向异性导电焊胶作为一种新型连接材料,相对于传统的锡银铜焊料而言,具备超细间距连接能力,且固化温度低,工艺简单,适合应用在Mini-LED显示的COB封装中。因此,本论文对基于各向异性导电焊胶的COB-LED芯片进行可靠性方面的研究。首
学位
环路热管(LHP)作为一种高效被动式传热元件,能够有效解决电子设备高速发展过程中的热管理限制。影响环路热管传热性能的因素主要有结构设计、工质选取和冷源温度等,其中研究工质对提升环路热管传热性能的影响尤为重要。自湿润流体是一种随着温度升高具有特殊表面张力变化的流体,其数值随温度的升高先降低到某一极小值后再升高。本文用正庚醇溶液制备自湿润流体,搭建了环路热管实验系统,通过实验对比水-LHP和0.1wt
眼球凝视估计是利用脸部图像中的眼部区域对眼睛的凝视方向与凝视点进行估计,判断其注意焦点的一种检测方法,其应用范围广具有重大经济价值。相比于早期的物理建模方法,基于深度学习方法的眼球凝视估计在准确率、稳定性、方便性等方面具有显著优势。目前,基于深度学习的单一凝视估计研究要么仅估计凝视点要么仅估计凝视方向,其性能还有提升的空间。基于此,本文主要研究将凝视点估计与凝视方向估计整合至同一个算法中,实现更为
随着无线通信技术的发展,基于位置的服务已经与我们的日常生活密不可分。不同于室外环境,室内环境中接收到的卫星信号很差并伴有复杂的多径条件,实现准确的定位是一项具有挑战性的工作。目前常见的室内定位技术往往需要多个接入点(Access Point,AP)的辅助,如基于接收信号强度指示(Received Signal Strength Indication,RSSI)的定位技术,而一些使用单接入点的定位技
随着空调市场逐渐趋于饱和以及铜材等原材料价格的上升,空调制造行业的生产压力也愈来愈大,而铜材作为空调系统中蒸发器、冷凝器、节流机构和各连接管道的主要生产原材料,其成本约占整个空调器原材料成本的15%,因此减少空调系统中铜材的使用对于降低空调器生产成本、提高企业竞争力具有重要意义。节流短管作为一种新型节流机构,相较于常用的传统毛细管节流组件,其结构简单,铜材消耗量更少,在价格上极具优势,并且节流短管
学位
随着人类社会对数据处理、数据存储系统与信息通信的需求不断增加,数据中心行业成为一个越来越重要的节能领域,数据中心用分离式热管作为一种高效节能的散热设备也受到越来越多的关注。因此,本文基于相变模型设计了为CPU散热的平板型蒸发器,对其内部的流动换热特性进行分析,并对传统结构进行优化;然后设计了用于机柜级散热的分离式热管散热器,从电能使用效率(PUE)及节能率两个方面对其应用于机柜级散热的节能潜力进行
学位
学位