摘要
本公开涉及模型评估技术领域,提供了一种问答模型评估方法、装置、电子设备及可读存储介质。该方法包括:获取原始问答模型对应的评估数据集和对比问答模型对应的评估数据集;将二者的评估数据集输入至训练完成的评估模型进行格式化处理,得到对应的格式化数据;基于至少一个预设的结果标签对各自对应的格式化数据分别进行前向传播处理,得到各个预设的结果标签对应的原始问答分数和对比问答分数;并对其分别进行归一化处理,得到各自对应的目标结果分数;根据该目标结果分数确定原始问答模型和对比问答模型的评估结果标签,并将评估结果标签发送至目标终端设备上进行展示,以此提升了模型的泛化能力和稳定性,确保了数据的多样性与准确性。
技术关键词
问答模型
格式化
数据
标签
模型评估技术
答案
终端设备
文本
电子设备
可读存储介质
大语言模型
处理器
评估装置
多阶段
模块
多模态
存储器
模板
转换器
参数
系统为您推荐了相关专利信息
模拟退火优化算法
气候
通信信号参数
支持向量机回归模型
固定设备
集群监控
监控组件
交换机
监控模块
人工智能系统
水源保护地
污染分析方法
分布特征
模式识别模型
土壤渗透系数
订单
自主移动机器人
分区
邻域搜索算法
拣货系统