大语言模型对齐方法、装置、电子设备及可读存储介质

AITNT
正文
推荐专利
大语言模型对齐方法、装置、电子设备及可读存储介质
申请号:CN202411461656
申请日期:2024-10-18
公开号:CN119513306A
公开日期:2025-02-25
类型:发明专利
摘要
本公开提供一种大语言模型对齐方法、装置、电子设备及可读存储介质,涉及机器学习技术领域。所述方法包括:获取待对齐的大语言模型对应的初始偏好数据集;基于多个所述初始偏好数据集的子集,训练得到每个所述初始偏好数据集的子集对应的奖励模型;确定所述奖励模型中的降噪模型;基于所述降噪模型将所述初始偏好数据集划分为高噪声偏好数据集及低噪声偏好数据集;确定所述高噪声偏好数据集对应的第一损失函数,以及所述低噪声偏好数据集对应的第二损失函数,并基于所述第一损失函数及所述第二损失函数优化所述奖励模型;基于优化后的奖励模型对所述待对齐的大语言模型进行对齐训练。本公开有效降低了噪声数据对奖励模型训练的影响。
技术关键词
降噪模型 对齐方法 损失函数优化 低噪声 大语言模型 梯度下降算法 噪声数据 机器学习技术 电子设备 平滑算法 对齐装置 计算机 数据采集模块 估计算法 人类 处理器 指令
系统为您推荐了相关专利信息
1
一种测量一次侧电流的交流量子电流互感器及方法
补偿磁场 磁通 信号处理终端 互感器 低噪声放大器
2
在线文档系统的自动部署方法、设备及存储介质
网页系统 在线 自动部署方法 标记语言文件 结构化界面
3
时间序列数据对齐方法、装置、设备及介质
基因表达数据 数据对齐方法 文本 时序 预训练语言模型
4
基于大模型和知识图谱的长输管网供热系统自动驾驶平台
供热系统 长输管网 大语言模型 数字孪生模型 图谱
5
一种基于轻量级yolov8的子宫内膜炎症分类识别方法及系统
子宫内膜炎症 宫腔镜 知识蒸馏技术 分类识别方法 模态特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号