【摘 要】
:
为进一步提升基于值函数强化学习的智能干扰决策算法的收敛速度,增强战场决策的有效性,设计了一种融合有效方差置信上界思想的改进Q学习智能通信干扰决策算法.该算法在Q学习算法的框架基础上,利用有效干扰动作的价值方差设置置信区间,从干扰动作空间中剔除置信度较低的干扰动作,减少干扰方在未知环境中不必要的探索成本,加快其在干扰动作空间的搜索速度,并同步更新所有干扰动作的价值,进而加速学习最优干扰策略.通过将干扰决策场景建模为马尔科夫决策过程进行仿真实验,所构造的干扰实验结果表明:当通信方使用干扰方未知的干扰躲避策略变
【机 构】
:
空军工程大学 信息与导航学院,西安710077
论文部分内容阅读
为进一步提升基于值函数强化学习的智能干扰决策算法的收敛速度,增强战场决策的有效性,设计了一种融合有效方差置信上界思想的改进Q学习智能通信干扰决策算法.该算法在Q学习算法的框架基础上,利用有效干扰动作的价值方差设置置信区间,从干扰动作空间中剔除置信度较低的干扰动作,减少干扰方在未知环境中不必要的探索成本,加快其在干扰动作空间的搜索速度,并同步更新所有干扰动作的价值,进而加速学习最优干扰策略.通过将干扰决策场景建模为马尔科夫决策过程进行仿真实验,所构造的干扰实验结果表明:当通信方使用干扰方未知的干扰躲避策略变更通信波道时,与现有基于强化学习的干扰决策算法相比,该算法在无通信方的先验信息条件下,收敛速度更快,可达到更高的干扰成功率,获得更大的干扰总收益.此外,该算法还适用于“多对多”协同对抗环境,可利用动作剔除方法降低联合干扰动作的空间维度,相同实验条件下,其干扰成功率比传统Q学习决策算法高50%以上.
其他文献
在拉深成形过程中,纤维金属层板常见的失效模式主要有起皱、纤维拉伸断裂以及界面分层.受金属拉深成形测试的启发,经研究,当纤维金属层板以纤维拉伸断裂与界面分层失效为主要的失效模式时,可以将纤维应变引入到成形极限图中.但是,由于用于拉深测试的传统金属条状试样形状会干扰纤维金属层板内纤维应变的计算,因此,本研究设计了一种新型切槽形状试样.通过对比传统的条状试样和新型切槽试样的成形试验以考察玻璃纤维/聚酰胺树脂(Gf/PA)复合材料-铝合金层板的成形性能.研究结果表明:所设计的新型切槽试样可以将纤维计算的应变水平控
针对现有频谱分离方法进行声学场景分类研究时其分类准确率不高的问题,提出了一种基于梅尔频谱分离和长距离自校正卷积神经网络(long-distance self-calibration convolutional neural network,LSCNet)的声学场景分类方法.首先,介绍了频谱的谐波打击源分离原理,提出了一种梅尔频谱分离算法,将梅尔频谱分离出谐波分量、打击源分量和残差分量;然后,结合自校正神经网络和残差增强机制,提出了一种长距离自校正卷积神经网络;该模型采用频域自校正算法以及长距离增强机制来保
Variability of power generation due to the prevalence of cloud cover over solar photovoltaics (PV) power plants is a challenge faced by grid operators and independent system operators (ISOs) in the integration of solar energy into the grid. Solar forecast
为研究新型双箱型空腹圆弧钢拱的平面内稳定特性,采用理论推导与有限元数值模拟相结合的方法,研究其平面内弹性屈曲及弹塑性稳定承载力,分析剪力对拱截面破坏模式的影响,并建立了平面内稳定承载力的设计方法.首先,根据拱截面的剪力分布情况,研究了双箱型空腹圆弧钢拱截面整体剪切变形及弦腹杆剪切变形对平面内弹性屈曲的影响;推导出了考虑双剪切变形影响时,双箱型空腹圆弧钢拱的纯压弹性屈曲荷载公式.然后,参考轴心受压柱设计原理,引入稳定系数及正则化长细比,绘制了纯压状态下的稳定曲线.最后,分析了在几种常见荷载工况下,双箱型空腹
To solve the dead-zone in the output flow curve of the proportional flow valve without displacement sensor, a dead-zone compensation approach is proposed in this paper. Instead of detection and feedback of the valve spool position, the proposed approach a
Heavy metals-polluted water has negative impact on the ecosystem. In Malaysia, minimum discharge limit for Cu2+ and Zn2+ are 1 mg/L and 2 mg/L, respectively. Zeolite is a highly porous adsorbent and its performance is affected by various factors, includin
针对巷道掘进过程中掘进效率低的问题,采用双契形斜眼掏槽方式进行爆破,详细分析爆破工艺参数,设置起爆顺序,通过实际应用,结果表明,在使用双契形斜眼掏槽爆破方案后,平均进尺从试验前的1.2 m增加到1.8 m,炮眼深度从1.5 m增加到2.0 m,炮眼利用率从85%增加到90%,在巷道成型方面有了很大的改善,爆破效果显著.
In recent years, intensive studies have been carried out to find an alternative for Tin ( Sn)-Lead ( Pb ) solder alloys with increasing demand over lower temperature solder alloys in current electronic packaging industry. High temperature operational sold
Slinger is a rotary atomizer whose atomization performance is affected by the parameters of orifice. 8 kinds of orifices with different structure parameters were investigated, and an optimal diameter exists for the round orifice with that the spray SMD is
以长平煤矿3号煤层为例,设计了煤巷超前探测的基本原则与探测方案,论证了底抽巷穿层钻孔实施煤巷超前探放的安全可行性.研究结果表明,依据井田地质条件,井田3号煤层巷道掘进可划分为安全区域、受水威胁区域和异常区;制定在“安全区域”巷道超前探放孔控制超前距≥30m、帮距≤25 m的探测方案;底抽巷穿层钻孔完全覆盖3号煤层巷道帮距20 m、超前距30 m的要求,在“安全区域”底抽巷穿层钻孔实施煤层巷道超前钻探技术是安全可行的.研究结果提高了矿井安全生产效率,具有明显的经济效益.