一种基于标记增强学习的大语言模型多维偏好对齐方法及系统

正文

推荐专利

申请号：CN202510669015

申请日期：2025-05-23

公开号：CN120196748B

公开日期：2025-08-12

类型：发明专利

摘要

本发明公开了一种基于标记增强学习的大语言模型多维偏好对齐方法及系统。本发明方法包括：使用多个不同奖励模型对对话样本数据进行打分，得到样本偏好置信度，进行标记增强，并对偏好数据集进行重构；从重构的数据集中选定对话样本对大语言模型进行有监督训练之后，对大语言模型进行基于置信度的带权重直接偏好优化；结合普拉特缩放进行大语言模型校准，对大语言模型参数和校准参数进行迭代更新，实现多维人类偏好对齐的最优策略。本发明通过调用多个奖励模型作为人类代理来生成对话样本置信度，结合标记增强学习解决了主流对齐数据集中缺乏体现多维人类偏好特征的缺点，有效提升了大语言模型对话质量，具有广泛的实际应用前景。

技术关键词

对齐方法模型校准样本大语言模型梯度下降算法标记参数数据控制策略对齐系统三元组偏好特征对齐模块训练集计算机程序产品处理器重构模块

系统为您推荐了相关专利信息

信号处理板卡的设计方法、系统、装置及储存介质

信号处理板卡噪声系数机器学习模型计算机可读储存介质混频器

微束系统的结构生成方法、装置及设备

生成网络模型结构生成方法数据生成结构束线

反射率因子预测模型的训练方法、降雨量预测方法及装置

反射率降雨量预测方法因子局部特征信息雷达

一种基于播客系统的交互方法、装置、设备、介质及产品

自动语音识别话题交互方法大语言模型计算机程序产品

一种基于改进VAE与泊松融合的样本生成方法

样本生成方法融合方法图像数据处理技术分类阈值生成融合图像

一种基于标记增强学习的大语言模型多维偏好对齐方法及系统

站点导航

APP 下载