摘要
本申请提供一种垂直大模型训练方法、装置和设备。本申请提供的方法,包括:获取指定领域相关的第一指令数据集,并利用第一指令数据集对预训练的基础大模型进行微调,得到初始大模型;其中,预训练的基础大模型不限于利用指定领域相关的无监督数据进行预训练;获取指定领域相关的第二指令数据集;针对预设的多个自然语言处理任务中的每个自然语言处理任务,获取每个自然语言处理任务的第三指令数据集;利用第二指令数据集和多个自然语言处理任务的多个第三指令数据集对初始大模型进行微调,得到训练好的垂直大模型。本申请提供的垂直大模型训练方法、装置和设备,能够提升模型的理解、总结和推理能力,提升模型在特定领域的精度。
技术关键词
自然语言
指令
数据
模型训练方法
模型训练设备
模型训练装置
基础
处理器
模块
可读存储介质
存储器
模版
程序
计算机
精度
系统为您推荐了相关专利信息
数据处理方法
大语言模型
结构化查询语句
脚本
非易失性存储介质
电力需求预测方法
LSTM神经网络模型
多层次
广义最小二乘法
生成电力
汽车轮毂盖
自动化控制方法
轮廓图像
缺陷类别
多通道卷积神经网络
深度强化学习
策略
充电站
计算机可执行指令
城市电网系统