一种面向中文语境的多模态理解与生成评测方法、系统

正文

推荐专利

申请号：CN202511038074

申请日期：2025-07-28

公开号：CN120932044A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种面向中文语境的多模态理解与生成评测方法，涉及大模型技术领域，构建面向中国元素特征的图像和视频评测数据集；构建参考答案文本，形成参考描述集；构建参考JSON；生成理解任务测试描述；生成任务测试描述；将理解任务测试描述，利用GPT‑4模型进行结构化字段对齐以构建理解任务测试JSON；将生成任务测试描述，利用GPT‑4模型进行结构化字段对齐以构建生成任务测试JSON；计算理解任务测试JSON与参考JSON的结构化字段的相似度、生成任务测试JSON与参考JSON的结构化字段的相似度；分别引入动态加权策略并计算各自总评分。本发明还公开了一种面向中文语境的多模态理解与生成评测系统，本发明实现了建立具备语境意识、可复现的标准化评测流程。

技术关键词

面向中文评测方法情境要素视频文本元素图像对象字段评测系统样本数据地标美食语义特征分辨率服饰格式策略

系统为您推荐了相关专利信息

基于低秩适应的大模型持续学习方法、装置、设备及介质

持续学习方法大语言模型矩阵文本基础

一种夜间车辆轨迹识别方法

车辆轨迹识别方法交通视频数据轨迹预测方法车灯亮度

一种融合深度估计与双视角视频的三维场景合成方法

融合深度图视角视频亮度场景

基于垂直场景及多模态的会议记录方法、系统、介质及装置

会议记录方法大语言模型语音数据场景

一种基于大语言模型的经验学习自适应预瞄控制方法

大语言模型货架托盘记忆轨迹场景

一种面向中文语境的多模态理解与生成评测方法、系统

站点导航

APP 下载