R学习相关硕士博士期刊学术论文 - 搜论网

R学习相关论文

基于平均型强化学习算法的动态调度方法的研究

论文主要研究了基于平均型强化学习算法的动态调度方法。实际的动态调度问题往往呈现出很大的复杂性:动态调度是一类信息不完全的......

学位

动态调度平均型强化学习 R学习函数逼近电梯群组调度

多步R学习算法

目的讨论平均准则下控制马氏链的强化学习算法,在事先未知状态转移矩阵及报酬函数的条件下,通过试凑法寻找使得长期每阶段期望平均......

期刊

强化学习平均报酬 R学习 Markov决策过程即时差分学习 reinforcement learning average reward R-learning

一种认知无线电系统的传输调度方案

将认知无线电系统中的传输调度方案建模为一个约束马尔科夫决策过程（CMDP），即在满足缓存器内包数约束的情况下最小化发送数据包消耗的......

期刊

认知无线电 R学习传输调度

看过本文同时还关注