摘要
本发明提供了一种大语言模型的训练方法、装置、设备及存储介质,属于自然语言处理技术领域,包括:获取大语言模型的原始训练数据集,基于原始训练数据集中的问题在知识库中进行检索,得到问题的多个相关文档和不相关文档;预测问题在多个相关文档中的答案和对应的概率,将预测的概率与预设阈值进行比较,若目标答案对应的预测概率大于或者等于预设阈值,则将目标答案所在的文档作为目标文档;基于目标文档构建问答样本,基于不相关文档构建拒答样本;基于问答样本和拒答样本对大语言模型进行训练。该方法能够降低大语言模型产生幻觉、生成无关内容的风险,提高大语言模型的准确率。
技术关键词
大语言模型
答案
样本
数据
处理器
训练装置
自然语言
语句
计算机设备
聚类
可读存储介质
模块
存储器
模板
风险
程序