摘要
本发明涉及人工智能技术领域,提供一种模型评测方法、装置、电子设备和存储介质,其中方法包括:基于模型评测能力体系,确定对待评测模型进行评测的多个能力评测维度以及各能力评测维度下的多个评测任务;获取任一能力评测维度下各评测任务的评测数据,并将评测数据输入至待评测模型中,得到任一能力评测维度下各评测任务对应的模型输出结果;基于模型评测指标体系,对任一能力评测维度下各评测任务对应的模型输出结果进行评测,得到任一能力评测维度的评测结果;基于各能力评测维度的评测结果和各能力评测维度的权重,确定待评测模型的评测结果。本发明能够实现对特定行业的大模型进行全面、客观、准确的评价。
技术关键词
模型评测方法
数据组织形式
指标
农业
样本
非暂态计算机可读存储介质
电子设备
评测装置
人工智能技术
处理器
导向型
存储器
有效性
场景
气象
基础
报告
社会
生物
系统为您推荐了相关专利信息
混合网络模型
PolSAR图像
通道注意力机制
地物分类方法
编码器
混合效应模型
一元线性回归模型
区域作物
时序
混合线性模型
数据中心机柜
智能监控管理系统
监控指标数据
智能调控
能耗