摘要
本申请提供了一种问答模型的训练方法、装置、电子设备、存储介质及程序产品;方法包括:基于携带有答案标签的第一问题样本,确定多条候选推理路径,候选推理路径用于指示,解决第一问题样本所对应的问题需要执行的推理步骤;将多条候选推理路径进行分类,得到归属于第一类别的第一推理路径和归属于第二类别的第二推理路径,第一推理路径的推理准确度大于第二推理路径的推理准确度;基于第一推理路径和答案标签,确定问答模型的第一损失值,并基于第一推理路径和第二推理路径,确定问答模型的第二损失值;基于第一损失值和第二损失值,对问答模型进行训练,得到目标问答模型。通过本申请,能够有效提高问答模型解决问题的性能。
技术关键词
问答模型
答案
样本
计算机可执行指令
标签
电子设备
计算机程序产品
训练装置
处理器
可读存储介质
模块
存储器