摘要
本发明公开了一种融合演化算法和强化学习的舰艇编队对抗模型确定及应用方法,该确定方法包括:构建对抗环境以及对抗环境中的我方舰艇编队和对方舰艇编队;将每个我方舰艇作为一个智能体,并采用DE‑MASAC算法对每个我方舰艇的初始对抗模型进行单独训练,得到每个我方舰艇的训练好的对抗模型;DE‑MASAC算法是融合了DE算法的MASAC算法,在DE‑MASAC算法中,DE算法用于在MASAC算法对每个我方舰艇的初始对抗模型进行单独训练的过程中,优化Actor网络的权重参数。本发明能够改善训练初期策略趋同和探索效率低的问题,提升智能体编队的协同对抗能力。
技术关键词
舰艇
演化算法
DE算法
兵棋推演平台
网络
参数
服务端
弹药
坐标
表达式
速度
策略
系统为您推荐了相关专利信息
生成有向无环图
有向无环图结构
矩阵
网络结构
特征值
服务访问方法
分数预测模型
注意力模型
客户端
访问第三方服务