摘要
本申请提供一种语言模型微调方法、装置、电子设备以及存储介质,涉及自然语言模型处理领域,包括:获取样本数据,样本数据包括数据质量不同的多种数据;基于第一语言模型对样本数据进行多次推理,生成多个结果信息以及多个过程信息;基于多个结果信息与样本数据的第一标签,确定损失权重;基于多个结果信息、多个过程信息以及与样本数据的第一标签,确定思维链数据;基于思维链数据以及损失权重,确定目标损失,并基于目标损失对待微调模型进行微调,得到目标语言模型。本申请分别通过损失权重以及思维链数据在待微调模型的优化中关注样本数据的质量以及模型推理的逻辑思维能力,有效提升语言模型的可解释性和数学能力、降低模型错误率。
技术关键词
微调方法
样本
标签
自然语言模型
电子设备
微调装置
数据模块
处理器
错误率
可读存储介质
存储器
指令
数学
基准
计算机