摘要
本说明书实施例涉及训练大语言模型的方法及装置。首先,获取数据集,其中包含第一问题及其对应的第一拒答回答和第一不安全回答,并包含第二问题及其对应的第二正常回答;第一问题中包含违规内容;然后,构造训练集,包括第一样本、第二样本和第三样本;第一样本包含作为输入文本的第一问题、被标记为偏好输出的第一拒答回答和被标记为非偏好输出的第一不安全回答;第二样本包含作为输入文本的第二问题、被标记为偏好输出的第二正常回答和被标记为非偏好输出的第一拒答回答;第三样本包含作为输入文本的第二问题、被标记为偏好输出的第二正常回答和被标记为非偏好输出的第一不安全回答;最后,根据训练集,基于偏好优化算法训练大语言模型。
技术关键词
大语言模型
样本
训练集
标记
文本
算法
训练语言模型
计算机
可读存储介质
存储器
基准
处理器
数值
系统为您推荐了相关专利信息
食管鳞癌诊断
检测食管鳞癌
诊断食管鳞癌
K近邻分类器
酶联免疫吸附法
图像分类模型
图像分类方法
样本
原型
蒙特卡洛算法
特征萃取器
故障诊断方法
设备监测数据
故障诊断模型
模块