论文部分内容阅读
无线通信网络的密集、异构和分散特性,使得传统的资源管理方法效率低。如何有效提升资源利用效率、降低网络延迟和能耗、提高网络数据传输安全性已经成为未来无线网络面临的关键难题。本文面向未来无线通信网络的发展趋势和重大需求,结合深度强化学习的基本思想,分别以提高频谱资源利用率和提升网络安全性为目标,逐步深入研究单智能体功率控制机制;多智能体频谱接入和功率分配策略;分布式联合用户关联、信道接入和时间帧选择策略。主要工作和创新点如下:本文在非正交多址接入双向中继无线网络体系架构下,设计基于物理层安全技术的无线资源管理机制。该机制的核心思想是利用无线信道的特性将信息从信源传输到预期的接收机,同时试图保护此信息被窃听者获取。考虑协作干扰和非协作干扰两种情况,提出联合子信道分配和功率分配的资源管理机制。此外,将复杂优化算法的输出作为标签,通过监督学习得到数据驱动的深度神经网络功率分配策略。结果表明,该机制有效提高了无线通信的安全性和网络计算效率。本文在认知无线电网络体系架构下,设计了一种基于深度强化学习的频谱共享机制。该机制的核心思想是将网络动态感知的无线传感器接收信号强度作为网络输入,从而学习次级用户的功率控制策略,实现主用户和次级用户的频谱共享。在认知无线电系统中次级用户无法获得主用户的功率分配信息,但可通过无线传感器的接收信号强度来调整其自身的功率。主用户根据其功率控制方案分配传输功率。针对次级用户,提出基于异步优势动作评价的功率控制方案和基于分布式近端策略优化的功率控制方案。两种方案均为并行学习框架,多个次级用户在不同的中央处理器线程上同时学习功率控制方案,减少了神经网络梯度更新的相互依赖性。结果表明,该机制可以根据无线传感器接收信号强度,动态调整次级用户功率,有效提高频谱利用率。本文在认知无线电网络中,在非完美状态信息下,设计基于多智能体强化学习的资源管理机制。该机制的核心思想是次级用户利用部分可观测信息学习资源分配策略,实现次级用户的频谱接入、模式选择和功率分配。在认知无线网络中,构建多个主用户,多个次级用户和多个信道的信息交互系统,将优化问题建模为多智能体部分可观测马尔科夫模型。提出基于深度强化学习的频谱接入和模式选择方案、基于深度强化学习的频谱接入和功率分配方案。结果表明,该机制可以根据部分可观测信息,动态调整次级用户的频谱接入、模式选择和功率分配,有效减少了用户间的碰撞和提高了无线资源利用率。本文在缓存使能的边缘物联网系统中,设计基于分布式强化学习的资源管理机制。该机制的核心思想是将存储资源扩展到网络边缘无线保真(WiFi,Wireless Fidelity)的缓存节点,物联网设备利用分布式深度强化学习资源管理策略从而提高移动运营商的收益。在时延敏感和高可靠性的通信环境中,构建联合用户关联、信道接入和帧选择的分布式资源管理模型。每个WiFi附近均有一个储存物联网设备所需信息的缓存节点,物联网设备通过学习接入到具有它所需信息的WiFi,从而减少端到端延迟和回程链路消耗。同时接入合适的信道和时间帧,减少接入设备间的碰撞和干扰。结果表明,该分布式机制可以动态调整物联网设备的关联WiFi、信道和时间帧,来提高移动运营商的收益。