模型训练优化方法、装置及计算设备

正文

推荐专利

模型训练优化方法、装置及计算设备

申请号：CN202510160927

申请日期：2025-02-13

公开号：CN120068988A

公开日期：2025-05-30

类型：发明专利

摘要

本说明书实施例提供模型训练优化方法、装置及计算设备，其中模型训练优化方法包括：获取强化学习模型，强化学习模型的强化学习过程包括推理阶段、前向传播阶段和模型训练阶段，推理阶段、前向传播阶段和模型训练阶段串行进行；在推理阶段结束后，卸载推理阶段使用的机器资源，在前向传播阶段和模型训练阶段，复用推理阶段使用的机器资源，基于推理阶段获得的样本数据对强化学习模型进行前向传播和模型训练。推理阶段结束后卸载所使用的机器资源，在前向传播阶段和模型训练阶段分时复用该推理阶段使用的机器资源，降低强化学习过程中所需的机器资源的数量，降低强化学习方法使用的门槛。

技术关键词

强化学习模型训练优化方法阶段计算机可执行指令资源优化器内存样本策略参数数据强化学习方法处理器计算机程序产品优化装置可读存储介质存储器键值门槛

系统为您推荐了相关专利信息

自监督深度估计网络训练方法、系统及存储介质

网络训练方法语义分割网络解码器编码器深度图

基于师生协作经验的目标检测知识蒸馏方法

知识蒸馏方法特征提取模块教师检测头调控策略

基于ORC的电池储能循环调控系统

电池液冷有机朗肯系统调控模型调控系统泄露保护装置

一种干旱灾害下农业产量预测方法

农业产量预测土壤水损失率随机森林模型时间预测方法

社区共享物流管控方法及系统

物流管控系统资源节点物流管控方法网络

模型训练优化方法、装置及计算设备

站点导航

APP 下载