基于预设错误模式的大语言模型负样本增强偏好优化方法

正文

推荐专利

申请号：CN202510950747

申请日期：2025-07-10

公开号：CN120448546B

公开日期：2025-09-23

类型：发明专利

摘要

本发明提供一种基于预设错误模式的大语言模型负样本增强偏好优化方法及装置，涉及大语言处理技术领域。该方法包括：基于对话问答场景，采集对话问题以及问题对应正确回答的数据，获得正样本数据集；定义大语言模型回答的错误类型；根据错误类型构建错误描述文本；基于自监督错误注入机制，根据错误描述文本以及正样本数据集，使用目标大语言模型进行数据生成，获得负样本数据集；使用正样本数据集以及负样本数据集，对目标大语言模型进行KTO偏好优化训练，获得优化大语言模型。本发明是一种基于错误模式的效率高且鲁棒性好的大语言模型负样本增强偏好优化方法。

技术关键词

大语言模型样本数据计算机可读取存储介质问答场景文本计算机可读指令优化设备优化装置机制处理器定义模块存储器鲁棒性答案逻辑链条参数

系统为您推荐了相关专利信息

一种识别变电站硬压板投退状态的方法及装置

变电站硬压板实时图像融合算法训练集状态监控技术

一种滤袋除尘系统运行监管方法

参数滤袋除尘监管方法曲线寿命预测模型

基于神经网络模型的景观设计识别方法和系统

神经网络模型光源色温多维特征向量照明设备光束

妊娠期糖尿病智能预测系统及方法

妊娠期糖尿病同步性智能预测系统生理智能预测方法

一种金属滑轨的加工方法

传送机构滚珠检测相机吸附装置传动轮组

基于预设错误模式的大语言模型负样本增强偏好优化方法

站点导航

APP 下载