基于深度强化学习的多无人机协同进攻作战智能规划

来源 :航空工程进展 | 被引量 : 0次 | 上传用户：musicwen5918

【摘要】

：

无人机依靠作战效费比高、灵活自主等优势逐步替代了有生力量作战，多无人机协同作战任务规划成为热点研究问题。针对传统任务规划采用的智能优化算法存在的依赖静态、低维的简单场景、机上计算较慢等不足，提出一种基于深度强化学习（DRL）的端到端的多无人机协同进攻智能规划方法。将压制敌防空作战（SEAD）任务规划过程建模为马尔科夫决策过程，建立基于近端策略优化（PPO）算法的SEAD智能规划模型，通过两组实验验

【作者】

：

李俊圣岳龙飞左家亮俞利新赵家乐

【机构】

：

空军工程大学空管领航学院

【出处】

：

航空工程进展

【发表日期】

：

2020年01期

【关键词】

：

多无人机深度学习深度强化学习 PPO算法泛化性协同作战

【基金项目】

：

国家自然科学基金（62106284）；陕西省自然科学基金（2021JQ-370）；军内科研项目（KJ20191A030153）；

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

炎帝与中华文化的创新

炎帝是中华农耕文明的创始者。根据中华民族众多传说以及《周易》、《管子》、《史记》、《淮南子》、《白虎通》、《世本》、《太平御览》、《路史》等的记载,相传炎帝始种五谷以为民食,制作耒耜以利耕耘,遍尝百草以医民恙,治麻为布以御民寒,陶冶器物以储民用,削桐为琴以怡民情,日中为市以利民生,剡木为矢以安民居,重演八卦以探天象,等等。炎帝带领中华民族的先民们在与自然和社会的

会议

兼容需求侧可调控资源的分布式能源系统经济优化运行及其求解算法

从分布式能源系统的优化研究着手,建立了兼容需求侧可调控资源的分布式能源系统经济优化运行模型,充分考虑了分布式能源系统中的电负荷、热负荷和冷负荷。其次,为能够解决上述多目标、非线性优化问题,提出了量子烟花算法（quantum fireworks algorithm,QFA）。最后,将所提出的模型及求解算法应用于我国西北地区某分布式能源系统的实际算例中,仿真结果表明:当分布式能源系统参与需求侧负荷优化

期刊

能源互联网分布式能源系统需求侧资源量子烟花算法

利用U型网络的遥感影像建筑物规则化提取

针对全卷积神经网络双线性插值及转置卷积算法在高分遥感影像建筑物提取任务中无法准确还原分割对象轮廓的问题，基于Unet网络建立改进的ResNeXt＿SPP＿Unet全卷积神经网络，并提出改进Douglas Peucker图像后处理算法完成建筑物提取规则化。ResNeXt＿SPP＿Unet网络重点优化两个方面，一是将Unet中的标准卷积替换为ResNeXt Block，在减少模型运算数量的同时提高网络

期刊

建筑物ResNeXt＿Unet深度学习GF-2Douglas Peucker

拯救与反思——求解富士康跳楼事件

2010年5月26日晚11点,富士康深圳龙华厂区大润发商场前发生一起员工跳楼事件,跳楼者当场死亡,这已经是富士康的第12起员工跳楼事件了。事实上,自2009年7月15日富士康25岁员工孙丹勇因工作差错不

期刊

民营企业全面预算管理的优化路径

近年来,随着我国经济的稳步发展,民营企业数量稳步增长,为社会提供了更多就业机会,为经济增长贡献了较大的力量。当前,民营企业在运营中存在很多管理问题,如在应用全面预算时,预算方案编制不科学、执行预算方案不彻底、预算管理效率低等,抑制了其发展。因此,民营企业要为预算的落实制定优化路径,不断完善预算管理制度,为企业营造良好的预算执行氛围。

期刊

民营企业全面预算管理优化路径

关于企业全面预算管理中绩效考评的研究

多年实践证明,鼓励全员参与到全面预算管理中,合理配置资源,通过管控、监督、分析和反馈,引导企业对经营活动做出改善和调整的程度,是实现企业在激烈的市场竞争中,适应市场环境,发挥竞争优势,实现利润最大化的保障。企业从市场环境的评估到销售收入的预测,从业务的开发到成本的估算,从项目的研发到产品下线等等,所有的环节都离不开全员配合。本文阐述了绩效考评机制对员工激励和发展的重要性,分析了绩效考评机制在企业中

期刊

全面预算绩效考评考评指标激励机制

绝缘子葡萄糖污秽的激光诱导击穿光谱检测

污秽成分差异是导致绝缘子沿面闪络特性差异的主要原因，葡萄糖污秽是华南产糖地区特有的特殊污秽。前期研究表明其强吸湿性可使得在较低相对湿度（75%）即可导致绝缘子放电及闪络发生。目前对葡萄糖这类污秽的检测只能采用取样实验室分析，缺乏带电现场分析手段。为此提出利用激光诱导击穿光谱技术，研究了快速鉴别葡萄糖污秽和定量检测方法。试验以13份葡萄糖含量不同的人工污秽为主要研究对象，采集葡萄糖、氯化钠、硫酸钙样

期刊

葡萄糖污秽激光诱导击穿光谱分类鉴别人工神经网络定量分析

基于LSTM-ResNet模型的定点有效波高预测

基于北部湾单站位浮标采集数据，提出一种基于长短期记忆网络（LSTM）和残差网络（ResNet）相融合的网络模型，将研究结果运用到短时波高预测中，并将模型的数值预测结果与LSTM网络、反向传播（BP）网络和ResNet网络在短时波高预测中的数值计算结果进行对比分析。结果表明：该模型在短时波高预测中，预测结果偏差较小且实用性较高，能够在一定条件下提高有效波高短期预测数值的有效性。

期刊

北部湾波高预测LSTM-ResNet网络LSTM网络

基于深度学习的潮位预报订正技术研究

引入长短期记忆神经网络（LSTM）深度学习先进算法，通过3折滑动时间序列交叉验证结合网格搜索方法确定最佳参数，构建了吴淞口潮位预报订正深度学习模型。结合风、压气象参数，对调和分析的预报潮位进行订正，得到更为准确的订正潮位，并与非线性自回归动态神经网络（NARX）浅层学习预报订正结果对比。结果表明：120 h预报潮位经LSTM模型订正后的均方根误差为0.102 m，平均绝对误差为0.084 m，订正

期刊

长短期记忆神经网络深度学习预报订正潮位吴淞口

基于共享语义空间的多标签文本分类

在多标签文本分类任务中，每个给定的文档都对应一组相关标签。目前主要面临以下三方面问题：（1）对标签-文本和标签-标签关系的联合建模不充分；（2）对标签本身语义的挖掘不足；（3）忽略了对标签内部结构信息的利用。对于以上问题，提出了一种基于联合注意力和共享语义空间的多标签文本分类方法。提出了融合多头注意力机制，该方法旨在同步地对标签与文档的关系和标签之间的关系进行建模，利用两者交互信息的同时避免误差传

期刊

多标签文本分类注意力机制标签表示预训练模型语义嵌入

基于深度强化学习的多无人机协同进攻作战智能规划

其他学术论文