一种大语言模型的训练方法、装置、设备及存储介质

AITNT
正文
推荐专利
一种大语言模型的训练方法、装置、设备及存储介质
申请号:CN202411570038
申请日期:2024-11-06
公开号:CN119066155A
公开日期:2024-12-03
类型:发明专利
摘要
本发明提供了一种大语言模型的训练方法、装置、设备及存储介质,属于自然语言处理技术领域,包括:获取大语言模型的原始训练数据集,基于原始训练数据集中的问题在知识库中进行检索,得到问题的多个相关文档和不相关文档;预测问题在多个相关文档中的答案和对应的概率,将预测的概率与预设阈值进行比较,若目标答案对应的预测概率大于或者等于预设阈值,则将目标答案所在的文档作为目标文档;基于目标文档构建问答样本,基于不相关文档构建拒答样本;基于问答样本和拒答样本对大语言模型进行训练。该方法能够降低大语言模型产生幻觉、生成无关内容的风险,提高大语言模型的准确率。
技术关键词
大语言模型 答案 样本 数据 处理器 训练装置 自然语言 语句 计算机设备 聚类 可读存储介质 模块 存储器 模板 风险 程序
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号