摘要
本说明书实施例公开了一种大语言模型微调方法及相关设备,涉及模型训练领域。在本说明书实施例中,通过待训练大语言模型得到多个问题分别对应的答案,以及每个问题对应答案的置信度,进一步根据预设的置信度条件筛选出多个问题中至少一个目标问题,该目标问题作为微调待训练大语言模型的样本。构建至少一个目标问题分别对应的答案生成指令,根据至少一个答案生成指令多次微调待训练大语言模型,以使待训练大语言模型基于答案生成指令输出确切答案或承认无知,直至满足微调条件时得到大语言模型。
技术关键词
大语言模型
生成指令
答案
微调方法
置信度计算方法
计算机存储介质
置信度阈值
计算机程序产品
模板
微调装置
处理器
解码
打印设备
模块
存储器
参数
传感器
样本
系统为您推荐了相关专利信息
人交互方法
执行用户意图
生成数字人
语义标签
文本
报销方法
财务
票据自动识别
历史数据管理
机器可读程序
智能匹配方法
大语言模型
人机界面
关键字
随机噪声