一种大语言模型的优化方法及装置

正文

推荐专利

一种大语言模型的优化方法及装置

申请号：CN202510771871

申请日期：2025-06-10

公开号：CN120893476A

公开日期：2025-11-04

类型：发明专利

摘要

本说明书实施例公开了一种大语言模型的优化方法及装置，该方法通过少量人工标注数据合成偏好数据，可以生成大量高质量、一致性的训练样本，在节省训练时间和训练成本的同时，保障大语言模型的学习效果。该方法采用的直接偏好优化方法相比传统的强化学习方法更加稳定、高效，能够更好地保持大语言模型性能的稳定性。本说明书实施例所述的大语言模型的优化装置同样具有上述有益效果。

技术关键词

大语言模型样本扩展模块优化装置强化学习方法基础电子设备可读存储介质数据获取模块存储器标签程序计算机处理器

系统为您推荐了相关专利信息

一种微粗糙度零件的机械加工工艺识别方法

机械加工工艺径向基函数神经网络声波特征变量识别方法

票据处理方法、装置、计算机设备及存储介质

票据节点私钥计算机设备数据

基于Lasso-Boruta-gcforest算法的烟叶采收成熟度鉴别方法及设备

图像特征值多粒度级联森林鉴别方法遗传算法随机森林

一种基于改进深度学习声纹识别的方法

深度学习声纹识别语音样本年龄数据排列方法

一种基于大语言模型的动态迭代式长视频理解方法

视频搜索视觉特征关键帧视频理解方法生成答案

一种大语言模型的优化方法及装置

站点导航

APP 下载