摘要
本申请提供一种大模型能力多维评测方法和装置,涉及人工智能技术领域,包括:基于模型评测能力体系,确定对各个待评测模型进行评测的多个能力评测维度;确定各个能力评测维度对应的评测题;基于各个能力评测维度对应的评测题,对各个待评测模型进行评测,确定各个待评测模型在各个能力评测维度下的评测结果;基于各个待评测模型在各个能力评测维度下的评测结果,确定各个待评测模型的多维评测结果。本申请提供的方法和装置,提高了大模型能力评测的准确性和全面性。
技术关键词
评测方法
非暂态计算机可读存储介质
处理器
评测装置
人工智能技术
计算机程序产品
种子
模块
存储器
电子设备
答案
数据
机制
指标
系统为您推荐了相关专利信息
声纹检测方法
故障分类模型
神经网络模型
注意力
数据
容错方法
键值
预训练语言模型
多层注意力
重构矩阵