对大模型进行多目标对齐训练的样本确定方法及装置

AITNT
正文
推荐专利
对大模型进行多目标对齐训练的样本确定方法及装置
申请号:CN202510337642
申请日期:2025-03-20
公开号:CN120258138A
公开日期:2025-07-04
类型:发明专利
摘要
本说明书实施例针对大模型的多目标对齐训练,跳出对大模型训练方法改进的思路,从训练数据上进行改进。根据一个实施方式,基于各个业务目标的偏好样本集,对偏好样本基于提示信息进行扩展和筛选,在扩展得到的候选响应中,筛选出满足奖励一致性的候选数据对,单个候选数据对包括候选正例和候选负例,奖励一致性是指候选正例在各个业务目标上的奖励均大于候选负例在相应业务目标的奖励,然后,对于满足奖励一致性的候选数据对,再根据候选正例和候选负例在业务目标k上的奖励差,从各个候选数据对中选择目标数据对,与相应的提示信息一起构建目标样本。如此,可以为多目标对齐提供一种更为高效和稳定的解决方案。
技术关键词
数据 样本 模型训练方法 周期 扩展单元 编码向量 过滤单元 参数 计算机 可读存储介质 存储器 处理器 思路 序列
系统为您推荐了相关专利信息
1
领域级智能体系统构建方法和系统及智能问答方法和系统
智能体系统 智能问答方法 生成智能 语义 指令
2
跨BANK传输的LVDS接收电路及LVDS发送电路
可编程锁相环 全局时钟 发送电路 缓冲器 延时模块
3
基于单泵多阀系统的双边吸奶器控制方法
双边吸奶器 环境监测数据 决策 控制策略 误差系数
4
一种基于自适应热管理的电池管理系统
热管理策略 散热策略 电池管理系统 温度传感单元 云端数据处理
5
基于零样本难度感知的大语言模型路由方法、装置和设备
大语言模型 样本 数据 语义特征 嵌入特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号