用于强化学习的模型训练方法及装置、电子设备、介质

AITNT
正文
推荐专利
用于强化学习的模型训练方法及装置、电子设备、介质
申请号:CN202410911003
申请日期:2024-07-08
公开号:CN118821971A
公开日期:2024-10-22
类型:发明专利
摘要
本公开提供了一种用于强化学习的模型训练方法、用于强化学习的模型训练装置、电子设备及计算机可读存储介质,属于人工智能技术领域。该方法包括:获取样本库;样本库至少包括多个连续的样本状态信息;从样本库获取第一样本状态信息并输入第一预测模型,得到第一样本预测值,根据第一样本预测值和第一样本状态信息对应的标签信息确定第一损失值;从样本库获取第二样本状态信息和/或第三样本状态信息,根据第二样本状态信息和/或第三样本状态信息确定第二损失值;基于第一损失值和第二损失值更新第一预测模型的参数。本公开可以提高强化学习的模型训练的准确性和有效性。
技术关键词
样本 模型训练方法 聚类 模型训练装置 记忆 参数更新模块 电子设备 可读存储介质 人工智能技术 标签 处理器 计算机 有效性 指令 存储器
系统为您推荐了相关专利信息
1
一种基于联邦学习的异构模型训练方法及系统
适配器 模型训练方法 客户端 分类器 异构
2
一种面向燃气管网气损检测的智能体构建方法
体构建方法 燃气管 异常点 分析数据特征 数字孪生
3
用于暂停呼吸综合征的睡眠呼吸检测方法、系统及云平台
睡眠呼吸检测系统 睡眠呼吸检测方法 呼吸暂停事件 检测云平台 光纤传感器
4
一种基于知识图谱的网络安全风险评估方法、设备及介质
网络安全数据 网络安全知识图谱 网络安全事件 分词 生成知识图谱
5
车辆控制方法、装置、车辆、介质、程序产品及芯片系统
风格 车辆周边 参数 车辆控制方法 芯片系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号