论文部分内容阅读
两台机器以上的Flow shop调度问题是一个强NP难的问题,目前为止尚未出现求解该类问题的有效算法。本文结合针此类问题的邻域操作特征,基于强化学习思想提出一种具备学习能力的调度算法。算法以Q学习作为训练方法,通过持续的离线训练学习该类问题寻优搜索知识,从而提高其调度寻优能力。算法采用高斯核函数支持向量机对Q函数进行拟合,以此克服在Q学习过程中遇到状态过多难题。数值仿真结果显示所提算法对Flow shop问题具有很好调度寻优能力。