一种语言模型微调方法、装置、电子设备以及存储介质

AITNT
正文
推荐专利
一种语言模型微调方法、装置、电子设备以及存储介质
申请号:CN202411695343
申请日期:2024-11-25
公开号:CN119692465A
公开日期:2025-03-25
类型:发明专利
摘要
本申请提供一种语言模型微调方法、装置、电子设备以及存储介质,涉及自然语言模型处理领域,包括:获取样本数据,样本数据包括数据质量不同的多种数据;基于第一语言模型对样本数据进行多次推理,生成多个结果信息以及多个过程信息;基于多个结果信息与样本数据的第一标签,确定损失权重;基于多个结果信息、多个过程信息以及与样本数据的第一标签,确定思维链数据;基于思维链数据以及损失权重,确定目标损失,并基于目标损失对待微调模型进行微调,得到目标语言模型。本申请分别通过损失权重以及思维链数据在待微调模型的优化中关注样本数据的质量以及模型推理的逻辑思维能力,有效提升语言模型的可解释性和数学能力、降低模型错误率。
技术关键词
微调方法 样本 标签 自然语言模型 电子设备 微调装置 数据模块 处理器 错误率 可读存储介质 存储器 指令 数学 基准 计算机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号