一种多模态图表问答大模型的评价测试方法、介质及设备

正文

推荐专利

申请号：CN202411808970

申请日期：2024-12-10

公开号：CN119760369B

公开日期：2025-11-14

类型：发明专利

摘要

本发明涉及大模型评测领域，特别是涉及一种多模态图表问答大模型的评价测试方法、介质及设备。包括：将判断类测试数据集，输入待评测大模型，以获取判断类模型输出结果。判断类问答对中的问题信息包括对问题本体文本及对回答信息只能是正面或反面信息的提示信息。将所有填空类模型输出结果、选择类模型输出结果及判断类模型输出结果的准确性信息进行统计，生成待评测大模型的执行评价信息。本发明中鉴于多模态大模型对指令的遵循可能存在潜在的变异性，所以在针对低阶任务性能的评价中，使用的指令类型包括从正面和负面角度提出的判断题、填空题和选择题三种题型来对待评测模型进行提问，由此来更加全面的对待评测大模型进行评测。

技术关键词

图表评价测试方法图片多模态生成测试数据生成答案文本多轮对话处理器饼状图信息检索种子正面指令存储器电子设备极值介质观点

系统为您推荐了相关专利信息

多模态超声与监护信息驱动的腹部闭合性损伤伤情评估模型构建方法

评估模型构建方法血流回声图像多模态

基于多模态传感的奶牛粪便自动评分系统及方法

奶牛粪便自动评分系统自动评分方法多模态图像采集单元

基于多模态数据融合的纸张表面缺陷检测方法及系统

纸张表面缺陷检测图像获取设备多模态数据融合待测纸张二维激光雷达

一种玉米栽培用施肥装置及施肥工艺

施肥装置施肥工艺移动平台探针支架原料储存罐

基于5G物联网技术的患者护理智能预警系统及方法

时序生命体征数据远程监控服务器协方差矩阵 5G物联网技术

一种多模态图表问答大模型的评价测试方法、介质及设备

站点导航

APP 下载