大语言模型的偏好对齐训练方法、系统、介质及电子设备

AITNT
正文
推荐专利
大语言模型的偏好对齐训练方法、系统、介质及电子设备
申请号:CN202411866588
申请日期:2024-12-18
公开号:CN119336899A
公开日期:2025-01-21
类型:发明专利
摘要
本申请提供一种大语言模型的偏好对齐训练方法、系统、介质及电子设备,所述方法包括:获取待训练文本;输入所述待训练文本及一任务提示至一融合dora模块的大语言模型中以产生一训练输出文本;所述任务提示用于命令所述大语言模型基于所述待训练文本执行任务;基于所述待训练文本和所述训练输出文本对所述大语言模型进行偏好对齐训练。本申请能够根据训练数据将大语言模型泛化到各个场景,有效解决训练资源不足的问题。同时,本申请更好地利用偏好信息,减少过拟合风险,保证训练获得的大语言模型与人类价值偏好对齐。
技术关键词
大语言模型 文本 训练系统 电子设备 数据 存储计算机程序 矩阵 命令 存储器 输入模块 参数 可读存储介质 处理器 人类 场景 风险
系统为您推荐了相关专利信息
1
一种人物图像重建方法、装置、电子设备及存储介质
人体模型 图像重建方法 人物模型 对象 顶点
2
张量数据交换电路、数据流处理装置及方法
数据交换电路 无阻塞 数据格式 数据流处理器 网络
3
组网式配电柜/箱物联监测系统
配电模块 加密机构 综合监控平台 加密数据 魔方
4
一种老旧建筑的能源消耗监测与控制方法、设备及介质
能耗预测模型 智能调控 时序 深度置信网络 长短期记忆网络
5
一种具备高效数据整合功能的供货第三方电商刊登系统
刊登系统 电商 数据接收模块 数据处理模块 标签模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号