摘要
本公开提出了一种检索模型的训练方法、答复获取方法和装置,涉及自然语言处理和深度学习等人工智能技术领域,方法包括获取待优化的候选大模型,并获取所述候选大模型对应的样本需求答复对,以得到所述候选大模型的微调样本;获取所述候选大模型基于所述微调样本输出的答复结果集合,并基于所述答复结果集合获取所述候选大模型在检索冗余性维度下的第一微调损失和答复事实性维度下的第二微调损失;基于所述第一微调损失和所述第二微调损失,对所述候选大模型进行迭代优化,得到优化后的目标大模型;基于所述目标大模型以及待训练的候选检索模型,得到目标检索模型。
技术关键词
样本
冗余
信息检索
标签
标识
人工智能技术
计算机程序产品
蒸馏
模块
训练装置
处理器通信
自然语言
指令
可读存储介质
存储器
电子设备
参数