一种基于数据对齐的大语言模型回复生成方法及系统

正文

推荐专利

申请号：CN202411529670

申请日期：2024-10-30

公开号：CN119474269A

公开日期：2025-02-18

类型：发明专利

摘要

一种基于数据对齐的大语言模型回复生成方法及系统，它属于大语言模型回复生成领域。本发明解决了现有大语言模型有害输出的风险大的问题。本发明首先通过COD提示收集有害问题数据集和无害问题数据集，并利用收集的数据集对模型进行预训练，再利用收集的数据集和提出的对齐策略对模型进行训练，以最小化有害响应的负对数似然，同时惩罚有害响应，通过梯度上升优化样本损失，以强化模型的正面行为。然后通过向对齐后的模型权重中添加一个安全向量来校正模型的安全性，可以在保持模型原始任务性能的同时补偿模型的安全性损失，显著降低模型产生有害输出的概率。本发明方法可以应用于大语言模型安全回复生成领域。

技术关键词

回复生成方法大语言模型数据对齐模块样本生成系统参数生成对输入策略两阶段变量校正风险正面

系统为您推荐了相关专利信息

文本校正的方法、装置、电子设备、存储介质及程序产品

文本校正计算机可读代码无监督聚类样本预训练模型

基于异常检测的数据样本标签噪声检测方法、装置及设备

时序特征数据噪声标签噪声检测方法蒙特卡罗

基于强化学习的车辆路径规划方法及装置

车辆路径规划方法样本车辆路径规划装置非暂态计算机可读存储介质参数

一种多层光学增透膜处理方法

光学增透膜误差监测参数厚度误差遗传算法

一种数据指标模型的构建及评估方法

指标训练算法对抗网络模型学习算法自动编码器

一种基于数据对齐的大语言模型回复生成方法及系统

站点导航

APP 下载