摘要
本申请涉及一种大语言模型训练方法和计算机设备。大语言模型训练方法包括:获取种子数据集和安全规则集;种子数据集包括:异常用户提问、与异常用户提问对应的正响应样本以及与异常用户提问对应的负响应样本;基于初始大语言模型,根据种子数据集和安全规则集,得到第一正推理样本和负推理样本;基于第一正推理样本、负推理样本以及种子数据集,构建第一偏好数据对,对初始大语言模型进行训练,得到训练完成的大语言模型。采用本方法能够解决在实际使用的过程中,用户通过提示词引导或外部知识注入的方式要求大语言模型输出有害的内容时,大语言模型会存在无法甄别用户的意图,输出有害内容的情况。
技术关键词
大语言模型
语言模型训练方法
异常用户
样本
种子
规则集
数据
计算机设备
算法
格式化
存储器
处理器
意图
系统为您推荐了相关专利信息
综合评价指数
智能编程方法
大语言模型
可视化界面
自然语言
产品需求文档
实体
统一资源定位符
知识图谱构建方法
大语言模型
支持向量机模型
车窗电机
训练集
变量
计算机可读指令