大语言模型的偏好对齐训练方法、系统、介质及电子设备

正文

推荐专利

申请号：CN202411866588

申请日期：2024-12-18

公开号：CN119336899A

公开日期：2025-01-21

类型：发明专利

摘要

本申请提供一种大语言模型的偏好对齐训练方法、系统、介质及电子设备，所述方法包括：获取待训练文本；输入所述待训练文本及一任务提示至一融合dora模块的大语言模型中以产生一训练输出文本；所述任务提示用于命令所述大语言模型基于所述待训练文本执行任务；基于所述待训练文本和所述训练输出文本对所述大语言模型进行偏好对齐训练。本申请能够根据训练数据将大语言模型泛化到各个场景，有效解决训练资源不足的问题。同时，本申请更好地利用偏好信息，减少过拟合风险，保证训练获得的大语言模型与人类价值偏好对齐。

技术关键词

大语言模型文本训练系统电子设备数据存储计算机程序矩阵命令存储器输入模块参数可读存储介质处理器人类场景风险

系统为您推荐了相关专利信息

一种人物图像重建方法、装置、电子设备及存储介质

人体模型图像重建方法人物模型对象顶点

张量数据交换电路、数据流处理装置及方法

数据交换电路无阻塞数据格式数据流处理器网络

组网式配电柜/箱物联监测系统

配电模块加密机构综合监控平台加密数据魔方

一种老旧建筑的能源消耗监测与控制方法、设备及介质

能耗预测模型智能调控时序深度置信网络长短期记忆网络

一种具备高效数据整合功能的供货第三方电商刊登系统

刊登系统电商数据接收模块数据处理模块标签模块

大语言模型的偏好对齐训练方法、系统、介质及电子设备

站点导航

APP 下载