摘要
本发明公开了一种面向舰艇编队基于差分进化的MADDPG超网络参数优化方法,该方法包括:构建舰艇编队协同作战的环境,将舰艇设置为智能体,为智能体设置任务信息;加载任务信息,生成初始策略;根据初始策略,智能体与环境进行交互并收集数据;根据数据训练MADDPG模型的超网络参数,并采用差分进化算法优化超网络参数,得到最优参数组合;将最优参数组合加载到MADDPG模型中,并评估智能体的表现,得到评估结果;根据评估结果对初始策略进行优化,再次让智能体与环境进行交互并收集新数据,根据新数据调整超网络参数,进行迭代优化超网络参数,直至得到最终的训练模型。本发明实现了多智能体策略网络的协同进化优化,提升了策略网络收敛速度与稳定性。
技术关键词
参数优化方法
舰艇
超网络
进化算法
代表
误差
智能体系统
网络结构
数据
因子
变异策略
战场环境
索引
网络架构
偏差
决策