一种基于结构化理解的低幻觉多Agent图片问答系统的构建方法及介质

正文

推荐专利

申请号：CN202510292748

申请日期：2025-03-12

公开号：CN120256561A

公开日期：2025-07-04

类型：发明专利

摘要

本发明属于大语言模型技术领域，提供了一种基于结构化理解的低幻觉多Agent图片问答系统的构建方法，包括：步骤S1：图片结构化理解的训练数据集构造：针对文本表单型图片数据、数据表型数据、图片分类和text2sql数据，分别构建训练数据集；步骤S2：四种Agent的联合训练：根据四种Agent，构造对应的prompt数据，将prompt数据混合到一起进行原始多模态大语言模型的训练，得到训练后的多模态大语言模型；步骤S3：基于训练后的多模态大语言模型，构建多Agent系统。根据本发明，有效地增强多模态大语言模型的图片内容理解能力，缓解多模态大语言模型的幻觉问题。

技术关键词

大语言模型多Agent系统问答系统多模态数据表结构关系型数据库表单图片类别图谱文本模版自然语言表格语句矩阵输出模块可读存储介质语义

系统为您推荐了相关专利信息

一种基于在线强化学习和GRPO的图像编辑模型训练方法

模型训练方法大语言模型策略在线编辑

一种肿瘤患者中西医结合全程护理管理系统

护理管理系统编码向量生理时序特征提取单元

一种基于人工智能的鼓膜修补术后创面评估方法

多模态图像数据生物力学特征样本创面评估生理

一种基于多模态交互的人形情感陪护机器人

陪护机器人多模态交互分析模块处理单元非接触式

全生命周期仿真数据可视化追踪与回溯分析平台

阶段仿真模型仿真数据实时数据核心

一种基于结构化理解的低幻觉多Agent图片问答系统的构建方法及介质

站点导航

APP 下载