一种垂直大模型训练方法、装置和设备

AITNT
正文
推荐专利
一种垂直大模型训练方法、装置和设备
申请号:CN202411089199
申请日期:2024-08-08
公开号:CN119067218A
公开日期:2024-12-03
类型:发明专利
摘要
本申请提供一种垂直大模型训练方法、装置和设备。本申请提供的方法,包括:获取指定领域相关的第一指令数据集,并利用第一指令数据集对预训练的基础大模型进行微调,得到初始大模型;其中,预训练的基础大模型不限于利用指定领域相关的无监督数据进行预训练;获取指定领域相关的第二指令数据集;针对预设的多个自然语言处理任务中的每个自然语言处理任务,获取每个自然语言处理任务的第三指令数据集;利用第二指令数据集和多个自然语言处理任务的多个第三指令数据集对初始大模型进行微调,得到训练好的垂直大模型。本申请提供的垂直大模型训练方法、装置和设备,能够提升模型的理解、总结和推理能力,提升模型在特定领域的精度。
技术关键词
自然语言 指令 数据 模型训练方法 模型训练设备 模型训练装置 基础 处理器 模块 可读存储介质 存储器 模版 程序 计算机 精度
系统为您推荐了相关专利信息
1
数据处理方法、装置、电子设备及非易失性存储介质
数据处理方法 大语言模型 结构化查询语句 脚本 非易失性存储介质
2
一种多层次电力需求预测方法及系统
电力需求预测方法 LSTM神经网络模型 多层次 广义最小二乘法 生成电力
3
基于人工智能的冲压件质量优化方法、系统及装置
冲压件 机械手末端执行器 仓库环境 坐标 传送带
4
基于顶出工艺的汽车轮毂盖生产线自动化控制方法及装置
汽车轮毂盖 自动化控制方法 轮廓图像 缺陷类别 多通道卷积神经网络
5
一种基于深度强化学习的电动汽车集群调度策略及系统
深度强化学习 策略 充电站 计算机可执行指令 城市电网系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号