摘要
本申请提供一种模型微调训练方法、答案输出方法、装置及电子设备,用于改善大语言模型的安全性较低的问题。该方法包括:获取待处理的多个问题文本;针对多个问题文本中的每个问题文本,获取该问题文本对应的原则关键词,并根据该问题文本和该问题文本对应的原则关键词生成该问题文本对应的提示文本;将该问题文本对应的提示文本输入大语言模型,以使大语言模型输出多个答案文本;从多个答案文本中确定安全性最高的答案文本;以每个问题文本对应的提示文本为训练数据,以安全性最高的答案文本为训练标签,对大语言模型进行微调训练,获得微调训练后的大语言模型。
技术关键词
文本
大语言模型
答案输出方法
关键词
机器可读指令
电子设备
处理器
可读存储介质
计算机程序产品
训练装置
标签
输出模块
存储器
数据
系统为您推荐了相关专利信息
知识图谱构建方法
三元组
实体识别模型
数据
构建知识图谱
任务分配算法
大语言模型
无人机集群
采集无人机
生成可执行代码
智能阅卷方法
学科知识图谱
知识点
答案
双向长短期记忆网络