【摘 要】
:
无人机依靠作战效费比高、灵活自主等优势逐步替代了有生力量作战,多无人机协同作战任务规划成为热点研究问题。针对传统任务规划采用的智能优化算法存在的依赖静态、低维的简单场景、机上计算较慢等不足,提出一种基于深度强化学习(DRL)的端到端的多无人机协同进攻智能规划方法。将压制敌防空作战(SEAD)任务规划过程建模为马尔科夫决策过程,建立基于近端策略优化(PPO)算法的SEAD智能规划模型,通过两组实验验
【基金项目】
:
国家自然科学基金(62106284); 陕西省自然科学基金(2021JQ-370); 军内科研项目(KJ20191A030153);
论文部分内容阅读
无人机依靠作战效费比高、灵活自主等优势逐步替代了有生力量作战,多无人机协同作战任务规划成为热点研究问题。针对传统任务规划采用的智能优化算法存在的依赖静态、低维的简单场景、机上计算较慢等不足,提出一种基于深度强化学习(DRL)的端到端的多无人机协同进攻智能规划方法。将压制敌防空作战(SEAD)任务规划过程建模为马尔科夫决策过程,建立基于近端策略优化(PPO)算法的SEAD智能规划模型,通过两组实验验证智能规划模型的有效性和鲁棒性。结果表明:基于DRL的智能规划方法可以实现快速、精细规划,适应未知、连续高维的环境态势,智能规划模型具有战术协同规划能力。
其他文献
炎帝是中华农耕文明的创始者。根据中华民族众多传说以及《周易》、《管子》、《史记》、《淮南子》、《白虎通》、《世本》、《太平御览》、《路史》等的记载,相传炎帝始种五谷以为民食,制作耒耜以利耕耘,遍尝百草以医民恙,治麻为布以御民寒,陶冶器物以储民用,削桐为琴以怡民情,日中为市以利民生,剡木为矢以安民居,重演八卦以探天象,等等。炎帝带领中华民族的先民们在与自然和社会的
从分布式能源系统的优化研究着手,建立了兼容需求侧可调控资源的分布式能源系统经济优化运行模型,充分考虑了分布式能源系统中的电负荷、热负荷和冷负荷。其次,为能够解决上述多目标、非线性优化问题,提出了量子烟花算法(quantum fireworks algorithm,QFA)。最后,将所提出的模型及求解算法应用于我国西北地区某分布式能源系统的实际算例中,仿真结果表明:当分布式能源系统参与需求侧负荷优化
针对全卷积神经网络双线性插值及转置卷积算法在高分遥感影像建筑物提取任务中无法准确还原分割对象轮廓的问题,基于Unet网络建立改进的ResNeXt_SPP_Unet全卷积神经网络,并提出改进Douglas Peucker图像后处理算法完成建筑物提取规则化。ResNeXt_SPP_Unet网络重点优化两个方面,一是将Unet中的标准卷积替换为ResNeXt Block,在减少模型运算数量的同时提高网络
2010年5月26日晚11点,富士康深圳龙华厂区大润发商场前发生一起员工跳楼事件,跳楼者当场死亡,这已经是富士康的第12起员工跳楼事件了。事实上,自2009年7月15日富士康25岁员工孙丹勇因工作差错不
近年来,随着我国经济的稳步发展,民营企业数量稳步增长,为社会提供了更多就业机会,为经济增长贡献了较大的力量。当前,民营企业在运营中存在很多管理问题,如在应用全面预算时,预算方案编制不科学、执行预算方案不彻底、预算管理效率低等,抑制了其发展。因此,民营企业要为预算的落实制定优化路径,不断完善预算管理制度,为企业营造良好的预算执行氛围。
多年实践证明,鼓励全员参与到全面预算管理中,合理配置资源,通过管控、监督、分析和反馈,引导企业对经营活动做出改善和调整的程度,是实现企业在激烈的市场竞争中,适应市场环境,发挥竞争优势,实现利润最大化的保障。企业从市场环境的评估到销售收入的预测,从业务的开发到成本的估算,从项目的研发到产品下线等等,所有的环节都离不开全员配合。本文阐述了绩效考评机制对员工激励和发展的重要性,分析了绩效考评机制在企业中
污秽成分差异是导致绝缘子沿面闪络特性差异的主要原因,葡萄糖污秽是华南产糖地区特有的特殊污秽。前期研究表明其强吸湿性可使得在较低相对湿度(75%)即可导致绝缘子放电及闪络发生。目前对葡萄糖这类污秽的检测只能采用取样实验室分析,缺乏带电现场分析手段。为此提出利用激光诱导击穿光谱技术,研究了快速鉴别葡萄糖污秽和定量检测方法。试验以13份葡萄糖含量不同的人工污秽为主要研究对象,采集葡萄糖、氯化钠、硫酸钙样
基于北部湾单站位浮标采集数据,提出一种基于长短期记忆网络(LSTM)和残差网络(ResNet)相融合的网络模型,将研究结果运用到短时波高预测中,并将模型的数值预测结果与LSTM网络、反向传播(BP)网络和ResNet网络在短时波高预测中的数值计算结果进行对比分析。结果表明:该模型在短时波高预测中,预测结果偏差较小且实用性较高,能够在一定条件下提高有效波高短期预测数值的有效性。
引入长短期记忆神经网络(LSTM)深度学习先进算法,通过3折滑动时间序列交叉验证结合网格搜索方法确定最佳参数,构建了吴淞口潮位预报订正深度学习模型。结合风、压气象参数,对调和分析的预报潮位进行订正,得到更为准确的订正潮位,并与非线性自回归动态神经网络(NARX)浅层学习预报订正结果对比。结果表明:120 h预报潮位经LSTM模型订正后的均方根误差为0.102 m,平均绝对误差为0.084 m,订正
在多标签文本分类任务中,每个给定的文档都对应一组相关标签。目前主要面临以下三方面问题:(1)对标签-文本和标签-标签关系的联合建模不充分;(2)对标签本身语义的挖掘不足;(3)忽略了对标签内部结构信息的利用。对于以上问题,提出了一种基于联合注意力和共享语义空间的多标签文本分类方法。提出了融合多头注意力机制,该方法旨在同步地对标签与文档的关系和标签之间的关系进行建模,利用两者交互信息的同时避免误差传