论文部分内容阅读
近年来,作为第五代移动通信系统中连接万物的基石技术,机器通信得到了很多的关注。不同于人的手持设备,在机器通信的场景中,单个蜂窝中就存在海量的设备。由此产生的机器通信上行连接请求数也将远超过人的手持设备的连接请求数。然而,当海量的随机接入请求同时涌现的时候,现行的蜂窝系统将不可避免地遇到严重的接入拥塞问题,因此需要设计专为机器通信定制的接入控制机制。研究者们提出了很多用于缓解接入冲突的方案,这些方案的内在思想主要是在接入控制层对海量接入请求进行分流和在物理层扩展接入的容量。然而,除了这些从接入控制层和物理层角度对吞吐量的考虑,时延也是一个需要关注的核心性能。事实上,诸如工业控制和实时监测等应用都对机器通信的时延提出了很高的要求。因此,对机器通信的时延性能进行优化是很有必要的。以此为动机,本文开展了对时延进行优化的大规模机器通信的相关研究。首先,本文考虑大规模机器通信随机接入的一般场景。根据机器通信设备是否具有探测信道状态的能力,本文将问题分为两个分支进行研究。对于机器通信设备不具有探测信道状态能力的情况,每个设备将以信道状态的期望值来估计信道,根据一定的策略决定是否尝试接入,并以常数功率发送数据;对于机器通信设备具有探测信道状态能力的情况,设备的接入决策和数据发送功率不仅与缓冲区队列长度有关,还需适应于信道状态。本文将这两个分支的时延优化的随机接入问题建模成无限时间平均代价马尔科夫决策过程。利用某个机器通信设备成功接入基站的概率的性质,本文将全局最优策略条件,即贝尔曼方程分解为每个设备的固定点方程。然后,通过对每个决策阶段的优化问题进行原始-对偶分解,本文得到基站辅助的分布式架构:基站端广播期望的同时尝试接入数和用于控制同时尝试接入数的拉格朗日乘子;设备端基于广播的信息,根据一定的策略得到决策行为。最后,本文提出分层随机学习算法来更新学习相关参数。不同于第一个分支,在考虑设备具有探测信道状态的能力时,本文通过定义切分行为,将系统状态空间降维,进而利用虚拟连续时间近似的方法来得到最优的渐进功率控制策略。接着,本文将一般场景扩展到两种具体场景:数据传输阶段采用非正交多址接入方式的场景和通过能量捕获技术来给设备供能的场景。在数据传输阶段采用非正交多址接入方式的场景中,由于非正交多址接入方式需要精细地分配接收功率域的功率点来满足成功解码的要求,并且要由基站端来进行中心控制调度,所以各个设备通过分解得到的固定点方程不仅通过随机接入耦合,还通过基站的中心式传输调度耦合。为了对不同于一般场景下的基站数据传输机会调度进行解耦,本文首先提出对接收功率域进行分层的概念,并将设备在接收功率域中的层级信息作为系统状态。随后,本文提出由基站维护在随机接入成功的情况下,设备处于不同接收功率层级和不同调度增益下最终成功发送数据的比例信息向量的设计,并将此信息广播给所有设备用于对未来的期望估计,从而实现了不同设备间的基站数据传输机会调度的解耦。在通过能量捕获技术来给设备供能的场景中,由于捕获能量具有随机到达的特性,除了数据队列状态信息和信道状态信息之外,能量队列信息也应被纳入到系统状态中来。本文为了得到从系统状态到接入和功率控制行为的映射策略,在将随机接入部分解耦合之后,利用一阶泰勒展开近似得到每个阶段的渐进最优的接入和功率控制行为关于势函数的闭合表达式。