用于强化学习的模型训练方法及装置、电子设备、介质

正文

推荐专利

申请号：CN202410911003

申请日期：2024-07-08

公开号：CN118821971A

公开日期：2024-10-22

类型：发明专利

摘要

本公开提供了一种用于强化学习的模型训练方法、用于强化学习的模型训练装置、电子设备及计算机可读存储介质，属于人工智能技术领域。该方法包括：获取样本库；样本库至少包括多个连续的样本状态信息；从样本库获取第一样本状态信息并输入第一预测模型，得到第一样本预测值，根据第一样本预测值和第一样本状态信息对应的标签信息确定第一损失值；从样本库获取第二样本状态信息和/或第三样本状态信息，根据第二样本状态信息和/或第三样本状态信息确定第二损失值；基于第一损失值和第二损失值更新第一预测模型的参数。本公开可以提高强化学习的模型训练的准确性和有效性。

技术关键词

样本模型训练方法聚类模型训练装置记忆参数更新模块电子设备可读存储介质人工智能技术标签处理器计算机有效性指令存储器

系统为您推荐了相关专利信息

一种基于联邦学习的异构模型训练方法及系统

适配器模型训练方法客户端分类器异构

一种面向燃气管网气损检测的智能体构建方法

体构建方法燃气管异常点分析数据特征数字孪生

用于暂停呼吸综合征的睡眠呼吸检测方法、系统及云平台

睡眠呼吸检测系统睡眠呼吸检测方法呼吸暂停事件检测云平台光纤传感器

一种基于知识图谱的网络安全风险评估方法、设备及介质

网络安全数据网络安全知识图谱网络安全事件分词生成知识图谱

车辆控制方法、装置、车辆、介质、程序产品及芯片系统

风格车辆周边参数车辆控制方法芯片系统

用于强化学习的模型训练方法及装置、电子设备、介质

站点导航

APP 下载