摘要
本公开涉及计算机技术领域,涉及一种模型评测方法及系统、计算机程序产品和电子设备。该模型评测方法包括:根据待评测模型的属性类型,分配多种评测任务,其中,不同的评测任务具有各自对应的评测数据集;根据当前评测任务的评测数据集,对待评测模型执行当前评测任务,得到初始评测结果,初始评测结果包括多个评测维度;基于初始评测结果对待评测任务的评测内容进行调整,以根据调整后的待评测任务对待评测模型执行评测操作;根据多种评测任务的初始评测结果,生成待评测模型的综合评测结果。本公开能提升对大模型评测的效率和覆盖范围,提高模型评测的准确性。
技术关键词
模型评测方法
性能指标数据
计算机程序产品
电子设备
评测系统
处理器
任务调度
模块
鲁棒性
标签
资源
指令
关系
存储器
系统为您推荐了相关专利信息
计算机设备配件
计算机配件
计算机执行指令
标识
内存
文本段落
检索文本相关性
数据处理方法
答案
计算机设备
固态硬盘状态
预测模型训练方法
信息预测方法
服务端
数据
接口调度方法
文本
实体
分层强化学习
计算机执行指令