摘要
本申请提供了一种智能体训练方法、数据配置方法、装置、介质和设备,该方法包括:获取开关效应信息样本,开关效应信息样本包括多个开关参数组合样本,以及多个开关参数组合样本中各开关参数组合样本在历史时间范围内对目标事务的影响效应数据,开关参数组合样本指示多个资源提供方中各资源提供方基于目标事务将资源转换为资产的资源提供比例;获取各资源提供方在历史时间范围的资源资产信息样本;基于开关效应信息样本和各资源提供方的资源资产信息样本,构建第一交互环境;基于第一交互环境对初始智能体进行强化学习训练,得到目标智能体。基于本申请方案,有助于利用目标智能体优化对各资源提供方的资源配置与管理。
技术关键词
开关
资源
资产
样本
参数
智能体训练方法
效应
数据配置方法
线性回归模型
计算机程序代码
数据配置装置
计算机程序产品
机制
时间段
可读存储介质
训练装置
电子设备
处理器
存储器
系统为您推荐了相关专利信息
电力光缆
出力优化方法
BP神经网络
出力场景
离线
预测模型建立方法
DBN模型
资产负债表
时序数据处理技术
BiLSTM模型
耕地
遥感识别方法
语义分割模型
高分辨率遥感影像
残差生成器
文本生成图像方法
视觉特征
文本编码器
图像编码器
上下文特征