论文部分内容阅读
在现代战争中,为了获取战场优势,在电子领域的争夺制电磁权的电子战被视为与传统陆、海、空战同等重要。雷达网络由于使用了多部雷达监控同一区域,因此当部分雷达受到干扰时,仍有一部分雷达能保持工作,这就让其有了一定的抗干扰能力,具有更好的战场生存能力。然而有源干扰技术的不断进步使多部干扰机协同对多部雷达的“网对网”式干扰成为可能。并且,干扰机在空域的分散使得干扰可能出现在雷达检测区域的任何位置,这也给雷达网络的抗干扰增加了难度。为了应对这些问题带来的挑战,提出了利用强化学习的思想的智能雷达网络抗有源干扰方法,利用由接收回波的信号特征与量测的行为特征训练神经网络,从而提高了雷达网络的抗干扰性能。本文所做工作,主要归纳如下:首先,说明了强化学习的基本结构与原理,对强化学习方法的可行性与迭代方式进行了分析,探讨了对于本课题而言,合适的强化学习方法,并通过仿真实验进行了说明。其次,设计了智能雷达网络的主体结构,研究了数据信号特征与行为特征的提取方式,和融合中心对经过智能体筛选的数据进行处理的融合方法,并对智能体的状态和奖励进行了设计,并通过仿真进行了验证。最后,提出了基于DQN的智能雷达网络的智能体的设计,并进行了仿真实验,证明了该方法的有效性即相对于传统方法的优越性。针对实时奖励收敛较慢,且与真实情况存在偏差,提出了利用未来奖励训练当前智能体的全新的奖励方法,并进行了仿真。针对DQN网络中,训练数据采样效率较低的问题,采取了归一化优先级采样的方法,提升了智能体的性能。为应对更加恶劣的情况,提出了使用双重DQN的方法,避免由于过估计而导致的DQN在复杂噪声下的训练困难问题,同时新方法降低了系统在更恶劣情况下的性能下降,提升了雷达网络的鲁棒性。仿真结果表明,该方法可以提升智能雷达网络的鲁棒性。