模型训练方法、装置、计算机设备、可读存储介质和程序产品

正文

推荐专利

申请号：CN202510749645

申请日期：2025-06-05

公开号：CN120706545A

公开日期：2025-09-26

类型：发明专利

摘要

本申请涉及一种模型训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。所述方法包括：通过推理模型对样本问题进行推理得到推理结果；按样本问题的难易程度类别，确定对应的推理长度控制超参数；根据推理长度控制超参数和推理结果的推理长度，构建推理长度奖励函数，以及根据推理结果构建推理准确性奖励函数；根据推理长度奖励函数和推理准确性奖励函数，对推理模型进行基于强化学习的模型训练。采用本方法训练得到的推理模型可以兼顾推理效率和准确性，可以实现更加高效和准确的推理过程。

技术关键词

超参数样本模型训练方法计算机设备计算机程序产品可读存储介质模型训练装置处理器模型更新答案模块存储器标签

系统为您推荐了相关专利信息

一种数据处理方法、系统及相关设备

浮点型数据符号数据处理方法数据压缩数值

基于IPKO-LightGBM的火控计算机电源模块故障预测方法

计算机电源模块故障预测模型故障预测方法梯度提升机训练样本数据

一种基于深度学习模型的绿色金融数据处理方法及系统

金融数据处理方法深度学习模型注意力机制样本金融数据处理系统

一种风电润滑诊断知识图谱的构建方法、设备及介质

随机森林模型风电图谱无故障工作时间节点

一种面向零样本的跨领域推荐方法和系统

物品特征层级大语言模型推荐方法概念

模型训练方法、装置、计算机设备、可读存储介质和程序产品

站点导航

APP 下载