摘要
本申请提供了一种多模态大模型的评测方法、装置、设备、存储介质及产品,涉及人工智能技术领域,方法包括:获取针对多模态大模型的测试计划;基于所述测试计划生成测试数据集,并将所述测试数据集随机拆分为试题数据和与所述试题数据相对应的答案数据;将所述试题数据输入所述多模态大模型,得到所述多模态大模型输出的答题结果;将所述答题结果与所述答案数据进行比对得到针对所述多模态大模型的评测结果。采用本申请能够确保对多模态大模型进行评测得到的评测结果的准确性,使得评测结果更加稳定可靠。
技术关键词
多模态
生成测试数据
评测方法
答题
答案
评测设备
生成随机数组
计算机程序产品
评测装置
可读存储介质
人工智能技术
处理器
文本
模块
存储器
基础
计划
系统为您推荐了相关专利信息
协同系统
信号
多模态信息
钻孔偏差
图像分析模型
执法记录仪
智能生成方法
语义特征
多模态情感分析
视频流
光学图像数据
肛瘘内口
定位导航系统
超声数据
瘘管
问答对生成方法
文本
意图识别模型
非暂态计算机可读存储介质
实体识别技术