摘要
本发明属于无人机集群博弈对抗技术领域,尤其涉及一种基于BC‑MAPPO的无人机集群协同对抗方法。本发明解决了一对一、多对一任务同时存在时的目标分配问题,有效利用专家经验来学习概率分布,同时提高了强化学习探索效率。首先,将对抗过程解耦使得目标分配阶段可以通过E‑CBAA算法实现,同时减少了BC‑MAPPO策略网络的冗余输入。其次,构建的E‑CBAA算法可同时进行一对一和多对一目标分配,适用场景更灵活。接着,引入行为克隆使得策略网络能够学习专家经验进行参数初始化,减少无谓动作对应的输出概率,增加有效探索。最后,对BC‑MAPPO的强化学习训练进一步优化了策略网络参数,获得更强的协同对抗能力。
技术关键词
无人机集群协同
作战单元
更新网络参数
无人机群对抗
监督学习框架
算法
通信网络架构
阶段
基地
场景
对抗技术
优化器
控制无人机
策略更新
数据
系统为您推荐了相关专利信息
无人机集群系统
无人车系统
中央管理平台
无人机集群协同
路径规划系统
温度控制方法
节点
隧道式加温加湿机
温度精确控制方法
多层感知机
波束成形向量
图像
时序神经网络
神经网络框架
视觉
智能故障诊断
蝙蝠算法优化
定位方法
电力电缆故障
信号
三维视觉定位方法
点云特征
视角
多模态特征
文本