一种任务适应性兵棋推演模型的快速训练与迁移方法

正文

推荐专利

申请号：CN202510102746

申请日期：2025-01-22

公开号：CN120087443A

公开日期：2025-06-03

类型：发明专利

摘要

本发明公开了一种任务适应性兵棋推演模型的快速训练与迁移方法，包括：获取当前环境的全动作空间；设计由单算子奖励、团队奖励和环境奖励构成的原始奖励，并基于全动作空间和原始奖励，采用带有经验回放池的近端策略优化算法进行强化学习训练，得到基础网络模型；冻结基础网络模型中底层网络，微调基础网络模型中高层网络，得到调整后的基础网络模型；设计由原始奖励、修正奖励、好奇心奖励和负奖励构成调整后的奖励，并基于调整后的基础网络模型和调整后的奖励，采用带有经验回放池的近端策略优化算法进行强化学习训练，得到迁移后的基础网络模型。本发明提升了兵棋推演系统在多任务作战场景中的决策灵活性和适应性，能够快速响应新的任务需求。

技术关键词

迁移方法网络策略基础参数动态掩模指数算法推演系统团队预测误差因子多任务决策场景元素速率

系统为您推荐了相关专利信息

实际储能与虚拟储能参与电力市场的优化调度方法、系统及介质

虚拟储能优化调度方法协同调度策略电力现货交易混合储能系统

基于人体深度估计及目标检测的眩晕灯控制方法及系统

灯控制方法行人检测模型眩晕人体积层

基于互联网医院的医患沟通风险评估与预警系统及方法

互联网医院患者预警系统消息数据收集机制

一种基于网络时延抑制的数字时钟远程计量方法

远程计量方法协方差矩阵时延数字时钟 LSTM神经网络

一种用于三维可变形网格模型的鲁棒水印方法

三维网格模型可变形网格水印方法水印嵌入顶点

一种任务适应性兵棋推演模型的快速训练与迁移方法

站点导航

APP 下载