摘要
本发明公开了一种问答模型的评估方法、装置、设备、介质及产品。该方法包括:获取问题数据集和至少两个问答模型分别对应的答案数据集;针对所述问题数据集中的样本问题,从至少两个答案数据集分别获取与所述样本问题对应的样本答案,并根据所述样本问题、至少两个样本答案和生成式评估模型,确定答案评估结果;其中,所述答案评估结果表征所述至少两个样本答案与所述样本问题匹配的优劣比较关系;根据至少一个答案评估结果,确定所述至少两个问答模型对应的模型评估结果,本发明实施例评估了问答模型在具体问题上的表现差异,提高了问答模型的评估结果的准确度和可靠性。
技术关键词
答案
问答模型
标签
样本
数据
可读存储介质
计算机程序产品
评估装置
电子设备
处理器通信
关系
存储器
模块
指令