摘要
本公开提供一种大语言模型对齐方法、装置、电子设备及可读存储介质,涉及机器学习技术领域。所述方法包括:获取待对齐的大语言模型对应的初始偏好数据集;基于多个所述初始偏好数据集的子集,训练得到每个所述初始偏好数据集的子集对应的奖励模型;确定所述奖励模型中的降噪模型;基于所述降噪模型将所述初始偏好数据集划分为高噪声偏好数据集及低噪声偏好数据集;确定所述高噪声偏好数据集对应的第一损失函数,以及所述低噪声偏好数据集对应的第二损失函数,并基于所述第一损失函数及所述第二损失函数优化所述奖励模型;基于优化后的奖励模型对所述待对齐的大语言模型进行对齐训练。本公开有效降低了噪声数据对奖励模型训练的影响。
技术关键词
降噪模型
对齐方法
损失函数优化
低噪声
大语言模型
梯度下降算法
噪声数据
机器学习技术
电子设备
平滑算法
对齐装置
计算机
数据采集模块
估计算法
人类
处理器
指令
系统为您推荐了相关专利信息
补偿磁场
磁通
信号处理终端
互感器
低噪声放大器
网页系统
在线
自动部署方法
标记语言文件
结构化界面
基因表达数据
数据对齐方法
文本
时序
预训练语言模型
供热系统
长输管网
大语言模型
数字孪生模型
图谱
子宫内膜炎症
宫腔镜
知识蒸馏技术
分类识别方法
模态特征