一种语言模型微调方法、装置、电子设备以及存储介质

正文

推荐专利

申请号：CN202411695343

申请日期：2024-11-25

公开号：CN119692465A

公开日期：2025-03-25

类型：发明专利

摘要

本申请提供一种语言模型微调方法、装置、电子设备以及存储介质，涉及自然语言模型处理领域，包括：获取样本数据，样本数据包括数据质量不同的多种数据；基于第一语言模型对样本数据进行多次推理，生成多个结果信息以及多个过程信息；基于多个结果信息与样本数据的第一标签，确定损失权重；基于多个结果信息、多个过程信息以及与样本数据的第一标签，确定思维链数据；基于思维链数据以及损失权重，确定目标损失，并基于目标损失对待微调模型进行微调，得到目标语言模型。本申请分别通过损失权重以及思维链数据在待微调模型的优化中关注样本数据的质量以及模型推理的逻辑思维能力，有效提升语言模型的可解释性和数学能力、降低模型错误率。

技术关键词

微调方法样本标签自然语言模型电子设备微调装置数据模块处理器错误率可读存储介质存储器指令数学基准计算机

一种语言模型微调方法、装置、电子设备以及存储介质

站点导航

APP 下载