摘要
本公开实施例是关于一种基于在线学习率优化机制的海战场智能对抗方法,该方法包括:计算网络模型的梯度,通过学习率优化模型为每层神经网络更新学习率,根据更新的学习率更新每层网络参数;更新基础元学习率,根据更新的基础元学习率更新网络模型及学习率优化模型的参数,将训练完成的模型部署到仿真环境中生成海战场多舰艇智能博弈对抗策略。本公开实施例相比传统作战行为建模方法,解决了大规模智能体对抗任务状态和动作空间爆炸问题;另一方面,在线学习率优化机制解决了MAML算法在训练过程中超参数设置难题,增强了网络训练的稳定性,提高了算法学习效率和最终表现,具有更强的鲁棒性和实用性。
技术关键词
智能博弈对抗
网络
仿真环境
在线
机制
参数
舰艇
表达式
基础
建模方法
鲁棒性
策略
代表
算法
轨迹
动态
系统为您推荐了相关专利信息
水利施工现场
施工管理平台
时空卷积神经网络
模拟模型
数据分析模块
纳米
网络结构
聚合物网络
混合凝胶
人体检测设备
能量管理方法
数字孪生模型
粒子群算法优化
储能
充放电策略
故障诊断模型
服务器磁盘
检测磁盘
磁盘故障检测方法
磁盘运行状态