摘要
本发明公开了一种面向中文语境的多模态理解与生成评测方法,涉及大模型技术领域,构建面向中国元素特征的图像和视频评测数据集;构建参考答案文本,形成参考描述集;构建参考JSON;生成理解任务测试描述;生成任务测试描述;将理解任务测试描述,利用GPT‑4模型进行结构化字段对齐以构建理解任务测试JSON;将生成任务测试描述,利用GPT‑4模型进行结构化字段对齐以构建生成任务测试JSON;计算理解任务测试JSON与参考JSON的结构化字段的相似度、生成任务测试JSON与参考JSON的结构化字段的相似度;分别引入动态加权策略并计算各自总评分。本发明还公开了一种面向中文语境的多模态理解与生成评测系统,本发明实现了建立具备语境意识、可复现的标准化评测流程。
技术关键词
面向中文
评测方法
情境要素
视频
文本
元素
图像
对象
字段
评测系统
样本
数据
地标
美食
语义特征
分辨率
服饰
格式
策略
系统为您推荐了相关专利信息
车辆轨迹识别方法
交通视频数据
轨迹预测方法
车灯
亮度