摘要
本申请公开了一种战场仿真方法、装置、设备及存储介质,涉及深度学习技术领域,包括:对目标计算机节点的节点性能与任务状态数据进行数据归一化处理并构建目标计算机节点的观测矩阵;基于各节点任务对应的任务动作定义对应的动作空间,并根据节点任务和目标计算机节点确定目标奖励函数;利用预设竞价调度方法从动作空间中确定目标计算机节点对应的目标可执行动作,并基于目标奖励函数、观测矩阵和目标计算机节点对应的目标可执行动作确定模型训练数据组;利用软演员‑评论家算法和模型训练数据组对初始策略网络模型进行模型训练以得到目标仿真决策模型,以便基于目标仿真决策模型完成针对目标战场的仿真。这样一来,可以提高战场仿真质量。
技术关键词
策略网络模型
节点
仿真方法
计算机
数据
矩阵
决策
深度学习技术
模型训练模块
对象
仿真装置
资源
算法
定义
队列
可读存储介质
处理器
电子设备
系统为您推荐了相关专利信息
手势识别方法
手势识别模型
雷达
多头注意力机制
特征提取模块
故障注入模块
车辆运行状态
力矩
数据
纵向速度控制
图像去模糊方法
深度图
去模糊图像
编解码模块
预训练模型
脑成像数据
多模态磁共振
数据分析模块
数据管理模块
数据统计模块