基于强化学习的组合优化综述

来源 :软件导刊 | 被引量 : 0次 | 上传用户:ZFsky260583
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
组合优化(CO)是运筹学的关键部分之一,近年来引起了学术界的极大兴趣。常见的解决此类问题的方法多数涉及到人工设计的启发式方法。因此,如何利用强化学习(RL)的决策过程生成CO问题的可行解,以及RL能否代替传统方法也是当前研究的重点。主要介绍CO与RL的基本定义、CO与RL框架之间协同作用的分类,最后探讨将CO与RL相结合的研究前景。
其他文献
应力强度因子是疲劳裂纹扩展的表征参量。为了探究材料断裂失效时微孔洞对于材料内部裂纹扩展的影响,基于有限元软件ABAQUS对6061铝合金材料构建力学性能模型。分别从孔洞到裂纹尖端的距离、角度和孔洞的大小3个方面研究应力强度因子的影响变化,并通过MATLAB进行不同参数的合并拟合确认其数学关系式,从理论上验证软件仿真拟合的合理性。仿真结果表明,孔洞往往会降低裂纹尖端的应力强度因子,且随着孔洞裂纹相对位置增加,其影响会呈幂函数分布减小,并且这一影响在45°左右时最为明显。研究表明,孔洞影响裂纹尖端的应力强度因
为对平衡功能障碍患者进行评估和康复训练,设计开发了一套平衡功能障碍智能训练系统。阐述了系统总体设计框架、硬件关键模块设计、平衡功能评估模块设计、患者档案设计、三维游戏设计以及智能算法实现。该系统具备丰富的三维游戏场景,能够对患者进行平衡功能训练,自动调整游戏参数,显示患者训练结果。设立对照组和实验组进行实验,结果表明,使用平衡功能训练仪的患者Berg平衡量表平均分数高于不使用该系统进行训练的患者,说明平衡功能障碍智能康复训练系统可以提高患者的平衡功能。
为帮助快销服饰企业制定合理的生产销售计划,提出结合ARIMA与RF模型的销售预测模型。通过对原始数据集进行数据预处理、特征筛选和特征降维处理,得到高质量的训练集,进而通过对参数的不断调优获得较好的实验模型,最后针对ARIMA模型无法更好地提炼非线性信息的问题,利用随机森林算法对非线性数据特征的学习能力,优化ARIMA模型预测残差,构建实验效果更好、预测精度更高的实验模型。实验结果表明,ARIMA-RF组合模型对此快销品牌销量预测结果的评价指标优于单个模型预测结果,相较于ARIMA模型,均方根误差和平均绝对