摘要
本申请提供一种大模型训练方法,其特征在于,包括:收集第一数据集,并利用所述第一数据集对第一模型进行微调训练,得到第二模型;收集第二数据集,基于所述第二模型,对所述第二数据集进行优化处理,得到第三数据集;利用所述第三数据集对所述第二模型进行训练,得到最终训练好的大模型。本申请实施例通过使用自引导策略,生成大量的链式思维数据,解决了链式思维数据缺乏的问题,提升了大模型的推理能力。
技术关键词
问答对数据
模型训练方法
计算机程序指令
模型训练装置
计算机程序产品
处理器
存储器
电子设备
模块
策略
关系
系统为您推荐了相关专利信息
信息抽取方法
矩阵
自然语言文本
损失函数优化
基座
内核
处理器
数据同步方法
数据存储
内存访问指令