基于智能体训练的奖励生成方法及相关装置

正文

推荐专利

基于智能体训练的奖励生成方法及相关装置

申请号：CN202511195408

申请日期：2025-08-25

公开号：CN121031708A

公开日期：2025-11-28

类型：发明专利

摘要

本公开提供一种基于智能体训练的奖励生成方法及相关装置，涉及计算机技术领域。该方法为：对结构化环境数据进行处理，获得不同维度的局部奖励信息；所述结构化环境数据为对智能体针对的外部环境所采集的外接环境数据处理后所获得的；对不同维度的奖励的权重信息进行调整，获得不同维度的奖励的融合权重信息；根据所述不同维度的局部奖励信息和不同维度的奖励的融合权重信息，确定综合奖励信息，以基于所述综合奖励信息对所述智能体进行策略更新。

技术关键词

策略更新生成方法轻量化神经网络数据输入接口计算机程序产品处理器复杂度生成装置动态处理单元非线性阶段电子设备指令存储器在线场景周期参数

系统为您推荐了相关专利信息

一种智能变电站安措校核方法及系统

实时监测数据数字孪生体校核方法后验概率策略

一种基于时序交互注意力机制的数据特征识别方法与系统

交互注意力特征识别方法特征值时序记忆单元

一种基于物联网的智慧物流路径评估方法

路径评估方法双模定位终端国密SM4算法物流梯度下降法

一种基于递阶最小二乘的电加热炉系统辨识方法

离散状态空间电加热炉系统参数辨识方法卡尔曼滤波状态空间模型

一种工程资金报表生成方法及系统

生成指令报表生成方法资金生成报表排序算法

基于智能体训练的奖励生成方法及相关装置

站点导航

APP 下载