基于替代迹的蜂窝网信道分配Actor-Critic算法

来源 :计算机应用研究 | 被引量 : 2次 | 上传用户:eyeknee1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对D2D混合蜂窝网络在进行信道分配时难以在较高信噪比条件下进行自动信道分配的问题,提出了一种基于替代迹的蜂窝网络信道分配Actor-Critic算法。首先定义了信道分配问题的MDP模型,然后定义了基于替代迹的Actor-Critic算法。Actor采用模拟退火探索策略自适应控制状态空间的搜索,将critic部分求解的值函数的时间差分误差用于更新该策略的优先级,再依优先级对策略进行更新;critic部分采用基于替代迹的值函数更新方式,并计算值函数的时间差分误差,以指导actor改进策略。实验结果表明
其他文献
针对干扰近似估计(interference approximation method,IAM)算法中提高FBMC/OQAM系统信道估计性能方案中噪声对性能的影响较大的问题,通过对传统干扰近似估计—实时(interference approximation method-real,IAM-R)信道估计算法进行改进,提出了一种基于等效导频功率最小值最大化的导频设计信道估计方案。该算法在传统IAM-R算
为了减少时效性要求较高的动态目标跟踪的调度时间,提出了一种基于多agent的自适应协同跟踪平台选择算法。首先,提出agent模型的应用;然后,以最小化调度时间和跟踪误差为目标建立适应度函数,采用合同网结合二值粒子群优化的方法,选出针对特定目标的最佳跟踪平台组合。仿真结果表明,与现有的几种算法相比,该算法有效地减少了调度时间,提高了跟踪精度,适用于实时性高的高速运动目标跟踪。
针对宽带OFDM系统中功放的记忆非线性失真问题,提出一种新的频域预失真方案。该方案在频域建立具有自适应更新的幅度、相位预失真矩阵,对信号幅度和相位分别进行多次预失真处理。为提高自适应预失真收敛速度,提出一种新的预失真矩阵自适应更新算法,即linear convergence算法。仿真结果表明,发送信号频谱旁瓣较二维查表法压低6 d B。误码率为10-4时,该方法比二维查表法约有2 d B的信噪比增
m子序列是根据m序列的状态转换特征,通过交叉改变状态转换次序而形成新的序列。通过随机性测试软件(NIST)验证m子序列具有与m序列相似的随机性,使用BM算法可以得出这种伪随机序列具有非常高的线性复杂度,同时验证了其补序列也具有非常高的线性复杂度,并说明m子序列具有良好的线性复杂度谱,抗线性攻击能力强。m子序列的数量庞大,一个周期为2~n-1的m序列,改变反馈函数就可以至少产生(2~(n-1)-1)