训练语言模型的方法及装置

正文

推荐专利

训练语言模型的方法及装置

申请号：CN202411545588

申请日期：2024-10-31

公开号：CN119415957A

公开日期：2025-02-11

类型：发明专利

摘要

本说明书实施例涉及训练大语言模型的方法及装置。首先，获取数据集，其中包含第一问题及其对应的第一拒答回答和第一不安全回答，并包含第二问题及其对应的第二正常回答；第一问题中包含违规内容；然后，构造训练集，包括第一样本、第二样本和第三样本；第一样本包含作为输入文本的第一问题、被标记为偏好输出的第一拒答回答和被标记为非偏好输出的第一不安全回答；第二样本包含作为输入文本的第二问题、被标记为偏好输出的第二正常回答和被标记为非偏好输出的第一拒答回答；第三样本包含作为输入文本的第二问题、被标记为偏好输出的第二正常回答和被标记为非偏好输出的第一不安全回答；最后，根据训练集，基于偏好优化算法训练大语言模型。

技术关键词

大语言模型样本训练集标记文本算法训练语言模型计算机可读存储介质存储器基准处理器数值

系统为您推荐了相关专利信息

细胞外囊泡标志物在制备检测食管鳞癌的产品中的应用

食管鳞癌诊断检测食管鳞癌诊断食管鳞癌 K近邻分类器酶联免疫吸附法

基于相似度不确定性优化的图像分类方法及系统

图像分类模型图像分类方法样本原型蒙特卡洛算法

一种双步协同半监督故障诊断方法及系统

特征萃取器故障诊断方法设备监测数据故障诊断模型模块

适用于商务系统的成本清单匹配方法、装置及存储介质

商务系统样本收入文本多任务学习方法

一种深度学习加速器软硬件协同方法及装置

抽样模型深度学习加速器参数样本优化器

训练语言模型的方法及装置

站点导航

APP 下载