摘要
本申请提供了一种视觉语言模型的测评方法、装置、设备、存储介质及产品,涉及模型测评技术领域,方法包括:获取车辆采集的图像数据,并基于所述图像数据构建测评数据集;所述测评数据集包括所述图像数据对应的标签文本数据;基于所述测评数据集中的标签文本数据对待测评的视觉语言模型进行测评,得到所述待测评的视觉语言模型的多个测评结果,所述多个测评结果中不同所述测评结果基于不同测评策略测评得到;基于所述多个测评结果,生成所述待测评的视觉语言模型的最终模型测评结果。采用本申请能够提升对VLM模型进行测评的准确性和全面性。
技术关键词
标签文本
数据
视觉
测评方法
图像
语义
格式化
测评设备
计算机程序产品
字段
测评技术
测评装置
可读存储介质
车辆
处理器
答案
策略
多阶段
存储器
系统为您推荐了相关专利信息
跨模态
估计方法
交叉注意力机制
多尺度特征融合
像素
数据包通信方法
LDPC编码器
LDPC译码器
伪随机二进制序列
时间同步