摘要
本公开公开了模型性能评估方法、装置、电子设备及存储介质,涉及计算机领域,尤其涉及大模型、深度学习等人工智能技术领域。具体实现方案为:首先获取多个样本报告,以及每个样本报告对应的至少一个标注对象,然后针对每个样本报告,将该样本报告输入待评估模型,获得待评估模型输出的至少一个预测对象,以及该样本报告对应的解读报告,之后针对多个标注键值对中的每个键,基于其对应的预测键值对及标注键值对,确定其对应的召回率,并确定每个样本报告对应的解读报告的评分值,最后基于各键分别对应的召回率,及多个解读报告的评分值,确定待评估模型的性能。
技术关键词
报告
键值
样本
性能评估方法
对象
性能评估装置
生成提示信息
电子设备
文本
人工智能技术
计算机程序产品
处理器通信
指令
输入模块
可读存储介质
存储器
模板