摘要
本发明提供一种引入动作交互和信用分配的无人机集群协同对抗方法,涉及无人机集群空对空对抗博弈决策技术领域。该方法首先对无人机集群的对抗空间、动作空间、状态空间和观测空间进行建模;通过动作匹配机制,实现对动作影响的细分,利用自注意力机制处理观测值与动作的不匹配,从而能保留可靠信息;通过最大化多个智能体的联合动作价值,确保无人机之间的最佳合作和策略;通过信用分配机制,使无人机在协作过程中能更准确地评估各自的贡献;该方法能够在部分可观测下进行无人机集群对抗博弈,提高了智能体学习策略的稳定性和对抗性能,为无人机集群对抗提供了新的方法和技术。
技术关键词
无人机集群协同
动作交互
无人机集群对抗
六自由度动力学模型
注意力机制
博弈决策技术
混合网络结构
连续动作空间
策略
训练智能体
强化学习算法
矩阵
参数
动态
系统为您推荐了相关专利信息
分词
条件随机场模型
文本识别方法
词嵌入模型
注意力机制
分类识别方法
多模态深度学习
位点
交叉注意力机制
文本
图像检测模型
红外图像检测方法
编码特征
多尺度特征
解码器
负荷预测方法
编码特征
多尺度局部特征
序列
变量
时间序列分类方法
注意力机制
分层注意力
优化器
模块