摘要
本公开公开了基于置信度的模型训练方法及装置、电子设备和存储介质,涉及人工智能技术领域,主要技术方案包括:首先,获取大语言模型生成的第一答案及对所述第一答案的第一置信度;其次,基于预设置信度阈值,筛选得到所述第一置信度低于所述预设置信度阈值的第二答案;最后,基于所述第二答案,执行对所述大语言模型的训练。与相关技术相比,本申请实施例通过基于大语言模型置信度对数据进行挑选,基于大预言模型的反馈信息,执行对大预言模型的演进及学习,无需外挂额外的设计文档辅助,因此训练数据更加契合大预言模型,具有更好的训练效果。
技术关键词
答案
大语言模型
置信度阈值
模型训练方法
模型训练装置
电子设备
人工智能技术
计算机程序产品
指令
处理器通信
可读存储介质
存储器
外挂
数据