摘要
本申请提供了一种仿真系统的训练方法、环境仿真方法、装置、电子设备、计算机可读存储介质及程序产品;方法包括:通过调控模型触发执行模型执行第一状态更新,得到执行模型的第一预测状态;通过调控模型触发执行模型应用样本策略,以及,在应用样本策略后,触发执行模型执行第二状态更新,得到在样本策略的影响下执行模型的第二预测状态;基于第一预测状态与第一状态更新的第一预设状态之间的第一差异,以及第二预测状态与第二状态更新的第二预设状态之间的第二差异,更新调控模型的参数和执行模型的参数,得到更新后的调控模型和更新后的执行模型。通过本申请,能够提高仿真系统的训练效率和预测的准确性。
技术关键词
调控模型
状态更新
环境仿真方法
仿真系统
计算机可执行指令
样本
对象
信息编码
可读存储介质
电子设备
参数
协作模式
仿真装置
策略更新
计算机程序产品
模型更新
系统为您推荐了相关专利信息
能力提升方法
灵活资源
优化调控模型
调控设备
可调控功率
图像内容数据
坐标
分区
计算机可执行指令
透明度
SystemVerilog语言
寄存器配置方法
待测芯片
地址映射表
序列
多轮对话方法
场景意图
大语言模型
对话策略
对话状态追踪
网络访问数据
风险识别方法
异常事件
时序特征
计算机可执行指令