面向人机物三元数据的热轧调度问题研究

来源 :控制与决策 | 被引量 : 0次 | 上传用户:robinchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着钢铁行业的数字化发展,其订单逐渐趋于多样化和随机化,这对热轧调度模型的适应性和灵活性等提出了新的要求.针对热轧调度问题,当前的主流方法是启发式算法,但其存在两个问题:一是没有考虑数据的组织表示;二是此类算法具有很强的针对性,当问题发生很小的改变就需要进行复杂的参数调整.相比之下,机器学习具有更好的适应性和灵活性,对此,采用本体进行人机物三元数据的组织表示,提出一种指针网络+强化学习的热轧调度求解方法.采用指针网络来学习序列到序列的映射,同时为解决指针网络训练困难和性能不高等问题,通过actor-critic网络进行训练,提高模型的准确性和收敛速度.最后,通过设计相应的实验对算法的性能进行仿真井与LK-H的局部搜索算法进行对比,进一步验证了所提出方法的有效性.
其他文献
针对传统蚁群算法难以精准解决多值属性系统(multi-valued attribute system,MVAS)诊断策略的问题,在改进蚁群算法的基础上,提出一种改进蚁群算法的测试序列寻优(ANT-TS)算法以搜索MVAS的故障测试序列.首先,引入多值D矩阵和五元组完成诊断策略的公式化处理;然后,为实现ANT-TS算法与MVAS诊断策略的融合,重新表述蚁群算法、设置状态转移规则、设定信息素初始化及更新的方式;最后,通过实例说明算法的实现过程,运用随机仿真实验验证其正确性和稳定性.结果表明:与传统蚁群算法相比
摘要:蜂窝纸板作为一种生活中越来越常见的结构,其性能已经得到很多人的重视。本文通过改变不同变量,研究蜂窝纸板的隔声性能,以期更好的生产此类产品,达到人们所期望的效果。通过声学边界条件,声波的反射和折射理论,来求出蜂窝纸板的隔声量公式,再带入不同变量:纸板尺寸、密度、厚度以及不同的蜂窝形状对隔声量的影响,得出蜂窝纸板隔声量优异情况时其纸板的状态,为后面蜂窝纸板在隔声中的生产提供一定帮助。  关键词:
产品需求的不确定性使得企业经常产生临时性或突发性的物流需求,物流服务现货市场采购在应对上述物流需求时发挥了重要的作用.在物流服务采购决策过程中,长期合同采购所提供的价格折扣受采购量的影响,因此对托运企业而言,如何平衡长期合同采购以及现货市场采购,从而在满足其物流需求的基础上使得总体采购成本最低,成为一个需要解决的问题.基于托运人的角度,建立以最小化运输服务采购成本及最大化整体满意度为目标,综合考虑承托双方偏好、承运方总量折扣及承运方运力接受范围等因素的运输服务混合采购决策模型,井设计多目标粒子群算法对上述
建立了熔融制样-X射线荧光光谱法(XRFS)同时测定白云石中氧化钙、氧化镁、二氧化硅、三氧化二铝、三氧化二铁、二氧化钛、氧化钾、氧化钠、五氧化二磷含量的方法.称取混合熔剂(由质量比67∶33的四硼酸锂和偏硼酸锂混合而成)6.0000 g,先将一半熔剂倒入铂-金坩埚中,然后加入碘化铵0.2g和干燥好的样品0.9000 g,混匀后,再将剩余的混合熔剂覆盖在表面,在1000℃熔融12 min,得到的玻璃样片供XRFS分析.以标准物质、光谱纯试剂和基准试剂混合熔融制备校准用标准样品系列,以经验α系数法进行基体校正
由于传统RRT(rapidly-exploring random trees)路径规划算法固有的盲目探索的问题,机器人到达目标点时除起始点扩展到目标点的路径之外还会生成其他与结果无关的分支路径与节点,为使这些分支路径得到利用并且减少探索的盲目性,提出基于信息增益与RRT思想相结合的机器人环境探索策略.该方法对未知环境中的节点进行信息估计,选取具有最大信息增益的节点作为采样节点,且每次都会生成最大信
晶圆图是由半导体生产过程中对晶圆进行可测试性检测而得到的,通过对晶圆图进行分类可以为生产过程中出现的问题提供依据,从而解决问题,降低生产成本.在对晶圆图进行分类之前,最重要的是特征提取,晶圆图除了本身拥有一定的空间图案以外,还存在着很多的噪声,影响着特征提取的过程.传统的DBSCAN算法用于滤波,需要人为确定两个参数,最小邻域Eps和最小点数MinPts,参数的选择直接影响了聚类的准确性.为此,提出一种基于优化DBSCAN聚类算法的滤波方式,自动确定DBSCAN的参数,以解决传统的手动设定参数的弊端.该算
电熔镁炉制备电熔镁砂的工艺过程中,会交替出现正常熔炼、加料和欠烧等多种不同工况,其中,欠烧工况分辨难度最大且最为关键.目前,欠烧工况的识别主要依靠人工经验完成,这种方式的准确性取决于人的经验水平和生理状态,且工人劳动强度大,存在容易漏检误检的问题.对此,依据不同工况下炉口火焰图像中具有的动态特征,提出一种基于B样条(B-spline)动态网络动态特性的工况识别技术.首先,建立炉口火焰的线性动态系统
基于政府补贴和增值税退税政策,通过Stackelberg博弈方法,建立由制造商、回收商和消费者组成的4种闭环供应链决策模型,得出相应的最优价格、补贴和退税政策.进一步,比较井分析4种不同模型下的回收价格、回收量、企业利润以及社会福利,得出政府和企业的最优决策选择.研究发现:1)4种情形下的社会福利均随着消费者环保意识的增加而递增.对政策制定者而言,若消费者环保意识较低,则政府补贴政策最优;若消费者环保意识较高,则政府补贴和增值税退税井存政策最优.2)在绿色消费者市场上,制造商选择高低两种不同定价策略受绿色
提出一种外部扰动/内部白噪声复合干扰和间歇性故障下的再入段变结构高超声速飞行器故障诊断和容错控制方法.首先给出再入姿态系统模型以及间歇故障模型.然后基于所研究的随机固定幅值故障模式对角速率系统中的周期性外部扰动进行预处理,根据处理结果,通过引入滑动时间窗设计一种残差信号.由于系统中存在白噪声,根据噪声分布特性井基于改进的残差信号提出两个假设检验,进而设计检测故障的两个阈值区间以检测间歇故障的发生和消失时间.与传统残差设计方法相比,改进的残差信号对于故障发生和消失时间的检测更准确.基于扩张系统设计一个自适应
生产商通过预售可以提前获取市场需求信息,但由于消费者产品估值的不确定性,生产商可能面临现货期大量退货的风险,制定合理的预售与退货策略成为生产商必须解决的核心问题.鉴于此,运用报童模型和消费者期望效用理论,考虑参照价格效应对消费者购买行为以及生产商预售期定价策略的影响,构建单一预售、预售退货不再出售、预售退货再出售3种策略下的期望利润模型,求解得到相应的最优生产量以及不同退货策略下的退货补偿价格取值范围,井对模型进行对比分析.研究表明:预售退货不再售与退货再售情形下,高价预售与低价预售策略中均存在一个退货补