摘要
本发明提供一种基于预设错误模式的大语言模型负样本增强偏好优化方法及装置,涉及大语言处理技术领域。该方法包括:基于对话问答场景,采集对话问题以及问题对应正确回答的数据,获得正样本数据集;定义大语言模型回答的错误类型;根据错误类型构建错误描述文本;基于自监督错误注入机制,根据错误描述文本以及正样本数据集,使用目标大语言模型进行数据生成,获得负样本数据集;使用正样本数据集以及负样本数据集,对目标大语言模型进行KTO偏好优化训练,获得优化大语言模型。本发明是一种基于错误模式的效率高且鲁棒性好的大语言模型负样本增强偏好优化方法。
技术关键词
大语言模型
样本
数据
计算机可读取存储介质
问答场景
文本
计算机可读指令
优化设备
优化装置
机制
处理器
定义
模块
存储器
鲁棒性
答案
逻辑
链条
参数
系统为您推荐了相关专利信息
变电站硬压板
实时图像
融合算法
训练集
状态监控技术
神经网络模型
光源色温
多维特征向量
照明设备
光束
妊娠期糖尿病
同步性
智能预测系统
生理
智能预测方法