摘要
本发明公开了一种基于大规模分布式混合无人与有人陆战对抗场景中的异构智能体协同策略训练方法,其包括以下步骤:步骤a.通过VBS仿真平台构建陆战对抗场景、红方作战智能体、蓝方作战智能体;步骤b.分别设置所述红方作战智能体和所述蓝方作战智能体的状态空间、动作空间和奖励函数;步骤c.构建策略网络和价值网络,并在所述策略网络和/或所述价值网络中插入跨智能体注意力机制;步骤d.通过大规模分布式训练,并行运行多实例仿真环境,策略网络融合跨智能体信息输出动作,价值网络评估联合动作价值,训练使模型收敛,并通过强化学习算法输出动作序列或仿真效果分析红方作战智能体的协同策略,提升异构智能体系统在陆战对抗场景中的协同作战能力。
技术关键词
注意力机制
策略
分布式训练
网络
异构
仿真平台
仿真环境
强化学习算法
智能体训练方法
场景
收集训练数据
多实例
智能体系统
武器弹药
可读存储介质
训练系统
处理器
坦克
程序
系统为您推荐了相关专利信息
长标距光纤光栅
盾构隧道监测
光信号
光纤网络
场景特征
标准化病人
大语言模型
问诊系统
数据存取模块
问诊方法
协调性评价方法
关键点
坐标
识别人体
长短期记忆模型