摘要
本发明公开了一种基于近端策略优化的多飞行器协同打击目标分配决策方法,属于多飞行器协同作战技术领域;本发明包括如下内容:构建目标分配优化问题模型;设计多飞行器协同打击目标分配问题的深度强化学习环境、构建深度网络模型,采取近端策略优化算法对网络模型进行训练;应用目标分配模型,实现对于协同打击目标分配问题的在线求解,输出分配方案和预期的总体打击收益,提高动态战场环境下的决策效率。本发明通过构建Actor‑Critic网络架构和训练方法优化,使模型在复杂约束条件和大规模应用场景下显著提升求解效能,能够针对不同规模的实际需求快速生成高精度分配方案,有效支持协同打击目标分配问题的实时在线求解。
技术关键词
深度网络模型
深度强化学习
多飞行器协同作战
决策方法
策略
弹药
节点数
战场环境
因子
参数
算法
定义
网络架构
变量
广义
在线
编码
系统为您推荐了相关专利信息
无人机协同
矩阵
决策方法
协作信息
长短期记忆网络
传感器节点
覆盖优化方法
网络覆盖优化
排挤策略
覆盖率
充电接口
充电设备
充电系统
防护装置
支持远程监控
检测仪本体
储能电站
传动伞齿轮
刀片
负荷控制算法