一种垂直大模型训练方法、装置和设备

正文

推荐专利

一种垂直大模型训练方法、装置和设备

申请号：CN202411089199

申请日期：2024-08-08

公开号：CN119067218A

公开日期：2024-12-03

类型：发明专利

摘要

本申请提供一种垂直大模型训练方法、装置和设备。本申请提供的方法，包括：获取指定领域相关的第一指令数据集，并利用第一指令数据集对预训练的基础大模型进行微调，得到初始大模型；其中，预训练的基础大模型不限于利用指定领域相关的无监督数据进行预训练；获取指定领域相关的第二指令数据集；针对预设的多个自然语言处理任务中的每个自然语言处理任务，获取每个自然语言处理任务的第三指令数据集；利用第二指令数据集和多个自然语言处理任务的多个第三指令数据集对初始大模型进行微调，得到训练好的垂直大模型。本申请提供的垂直大模型训练方法、装置和设备，能够提升模型的理解、总结和推理能力，提升模型在特定领域的精度。

技术关键词

自然语言指令数据模型训练方法模型训练设备模型训练装置基础处理器模块可读存储介质存储器模版程序计算机精度

系统为您推荐了相关专利信息

数据处理方法、装置、电子设备及非易失性存储介质

数据处理方法大语言模型结构化查询语句脚本非易失性存储介质

一种多层次电力需求预测方法及系统

电力需求预测方法 LSTM神经网络模型多层次广义最小二乘法生成电力

基于人工智能的冲压件质量优化方法、系统及装置

冲压件机械手末端执行器仓库环境坐标传送带

基于顶出工艺的汽车轮毂盖生产线自动化控制方法及装置

汽车轮毂盖自动化控制方法轮廓图像缺陷类别多通道卷积神经网络

一种基于深度强化学习的电动汽车集群调度策略及系统

深度强化学习策略充电站计算机可执行指令城市电网系统

一种垂直大模型训练方法、装置和设备

站点导航

APP 下载