一种基于结构化理解的低幻觉多Agent图片问答系统的构建方法及介质

AITNT
正文
推荐专利
一种基于结构化理解的低幻觉多Agent图片问答系统的构建方法及介质
申请号:CN202510292748
申请日期:2025-03-12
公开号:CN120256561A
公开日期:2025-07-04
类型:发明专利
摘要
本发明属于大语言模型技术领域,提供了一种基于结构化理解的低幻觉多Agent图片问答系统的构建方法,包括:步骤S1:图片结构化理解的训练数据集构造:针对文本表单型图片数据、数据表型数据、图片分类和text2sql数据,分别构建训练数据集;步骤S2:四种Agent的联合训练:根据四种Agent,构造对应的prompt数据,将prompt数据混合到一起进行原始多模态大语言模型的训练,得到训练后的多模态大语言模型;步骤S3:基于训练后的多模态大语言模型,构建多Agent系统。根据本发明,有效地增强多模态大语言模型的图片内容理解能力,缓解多模态大语言模型的幻觉问题。
技术关键词
大语言模型 多Agent系统 问答系统 多模态 数据表结构 关系型数据库 表单 图片类别 图谱 文本 模版 自然语言 表格 语句 矩阵 输出模块 可读存储介质 语义
系统为您推荐了相关专利信息
1
一种基于在线强化学习和GRPO的图像编辑模型训练方法
模型训练方法 大语言模型 策略 在线 编辑
2
一种肿瘤患者中西医结合全程护理管理系统
护理管理系统 编码向量 生理 时序 特征提取单元
3
一种基于人工智能的鼓膜修补术后创面评估方法
多模态图像数据 生物力学特征 样本 创面评估 生理
4
一种基于多模态交互的人形情感陪护机器人
陪护机器人 多模态交互 分析模块 处理单元 非接触式
5
全生命周期仿真数据可视化追踪与回溯分析平台
阶段 仿真模型 仿真数据 实时数据 核心
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号