大语言模型训练方法、装置、计算机设备、介质和产品

正文

推荐专利

申请号：CN202510026455

申请日期：2025-01-08

公开号：CN119539023A

公开日期：2025-02-28

类型：发明专利

摘要

本申请实施例提供一种大语言模型训练方法、装置、计算机设备、介质和产品，涉及模型训练技术领域。该方法先通过文本数据对初始MOE模型进行预训练，得到MOE预训练模型，然后通过第二训练集对MOE预训练模型进行多任务训练，使得训练得到MOE对话模型可以根据输入数据生成与输入数据相关的输出结果，从而完成各种不同的任务。最后，对MOE对话模型进行用户偏好引导，得到MOE奖励模型，以便于对MOE对话模型的输出结果进行评价，从而优化MOE对话模型的模型参数。本申请实施例中，使用MOE模型替换传统的稠密模型，通过MOE模型中的多专家子模型实现模型的不同功能，使用更少的推理显存实现多种功能。

技术关键词

语言模型训练方法训练集样本大语言模型 MLP神经网络计算机设备模型训练技术无监督数据可读存储介质存储计算机程序计算机程序产品文本训练装置多任务存储器标签处理器参数

系统为您推荐了相关专利信息

一种大语言模型的强化学习训练方法及相关设备

大语言模型学习训练方法学习训练装置计算机程序产品指标

舌诊图像生成方法、装置、设备及存储介质

舌诊图像噪声图像舌苔图像生成方法注意力

面向完备行车环境状态感知的高性能低成本多模态数据融合模型及设备

多模态数据融合高性能低成本交叉注意力机制焦点损失函数状态空间方程

文本查重方法、装置、电子设备及存储介质

关键词文本查重方法语义层次聚类算法查重装置

一种基于声波频率预测超声激发液滴体积的方法

一元线性回归模型粗大误差判断准则异常数据频率

大语言模型训练方法、装置、计算机设备、介质和产品

站点导航

APP 下载