摘要
本申请涉及人工智能技术领域,公开了一种基于认知心理学的多模态大模型评测系统及方法。该系统包括:评测执行模块,被配置为根据用户指定的至少一个评测指标,从评测题库中抽取对应的评测题目;所述评测指标是基于信息加工模型及认知心理学理论确定的,用于评测多模态大模型以下至少一个维度的性能:感知力、注意力、记忆力、推理力;分析模块,被配置为基于所述输出结果及所述评测题目的正确答案,计算所述多模态大模型的评测分数;基于所述评测分数生成所述多模态大模型的性能评测结果。本系统实现了对多模态大模型客观、全面的性能评测,能够准确反映模型的真实性能。
技术关键词
评测系统
指标
多模态
模型评测方法
分析模块
注意力
理论
答案
正确率
儿童智力
人工智能技术
量表
情景
记忆
编程
视觉
系统为您推荐了相关专利信息
数据分析方法
大语言模型
样本
生成图表
广告营销技术
文件自动生成方法
节点
项目
文本特征向量
非结构化文本
健康监测方法
频率
神经网络模型
智能跟踪模块
调节单元
需求预测模型
供应链需求预测
数据分析模块
因子
长短期记忆网络