一种大语言模型的训练方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411570038

申请日期：2024-11-06

公开号：CN119066155A

公开日期：2024-12-03

类型：发明专利

摘要

本发明提供了一种大语言模型的训练方法、装置、设备及存储介质，属于自然语言处理技术领域，包括：获取大语言模型的原始训练数据集，基于原始训练数据集中的问题在知识库中进行检索，得到问题的多个相关文档和不相关文档；预测问题在多个相关文档中的答案和对应的概率，将预测的概率与预设阈值进行比较，若目标答案对应的预测概率大于或者等于预设阈值，则将目标答案所在的文档作为目标文档；基于目标文档构建问答样本，基于不相关文档构建拒答样本；基于问答样本和拒答样本对大语言模型进行训练。该方法能够降低大语言模型产生幻觉、生成无关内容的风险，提高大语言模型的准确率。

技术关键词

大语言模型答案样本数据处理器训练装置自然语言语句计算机设备聚类可读存储介质模块存储器模板风险程序

一种大语言模型的训练方法、装置、设备及存储介质

站点导航

APP 下载