模型训练方法、装置、电子设备及存储介质

正文

推荐专利

模型训练方法、装置、电子设备及存储介质

申请号：CN202510916094

申请日期：2025-07-03

公开号：CN120409744B

公开日期：2025-09-26

类型：发明专利

摘要

本申请公开了一种模型训练方法、装置、电子设备及计算机存储介质。其中，该模型训练方法包括：基于预设训练样本集中的第一训练样本集对初始基线模型进行监督微调，得到监督微调模型以及偏好数据样本；基于偏好数据样本对初始奖励模型进行优化训练，得到目标奖励模型，以及基于偏好数据样本对监督微调模型进行优化训练，得到偏好优化模型；基于偏好优化模型和第一训练样本集生成第一奖励信号，以及基于偏好优化模型、目标奖励模型和预设训练样本集中的第二训练样本集生成第二奖励信号；基于第一奖励信号、第二奖励信号以及第二训练样本集对偏好优化模型进行优化训练，得到目标对象生成式预训练模型。采用该方法能够提升模型的泛化能力。

技术关键词

预训练模型训练样本数据训练样本集对象模型训练方法信号计算机存储介质基线模型训练装置无监督度量电子设备指标模块交互方法电商参数处理器

系统为您推荐了相关专利信息

应用文件的处理方法、应用内容的推荐方法及电子设备

分布式存储集群非易失性存储介质推荐方法节点加密算法

多维数据统计智能分析预测系统及方法

智能分析预测方法 LSTM模型分析预测系统时间序列特征输入结构

一种基于自适应优化修正增量算法的高斯混合建模方法

高斯混合模型混合建模方法协方差矩阵数据读取模块后验概率

模型训练方法、装置、计算机设备及存储介质

分区数据模型训练方法参数计算机设备

基于干扰来向动态预测的智能抗干扰波束形成方法

智能抗干扰天线阵元波束粒子群方法注意力

模型训练方法、装置、电子设备及存储介质

站点导航

APP 下载