多智能体协同的多模态推理方法、装置、电子设备和产品

正文

推荐专利

申请号：CN202511251609

申请日期：2025-09-03

公开号：CN120725166A

公开日期：2025-09-30

类型：发明专利

摘要

本申请涉及人工智能技术领域，提出一种多智能体协同的多模态推理方法、装置、电子设备和计算机程序产品。该方法设置了文本推理智能体、视觉理解智能体和判断型智能体共三个智能体，其中，文本推理智能体主导整体的文本逻辑推理，视觉理解智能体负责提供视觉语义信息，判断型智能体负责评估多模态推理的过程是否需要补充额外的视觉语义信息，并在需要补充的情况下触发视觉信息补充流程，引导视觉理解智能体提取所需补充的视觉语义信息。利用三个智能体的协同工作，形成了多模态推理、补充判断和信息补充的闭环机制，在无需执行复杂预处理流程的基础上，能够对多模态文档进行深度语义理解和逻辑推理，从而实现准确、完整的文档理解与答复文本生成。

技术关键词

多模态视觉文本图像多智能体协同推理方法语义缓存页面计算机程序产品电子设备列表指令推理装置人工智能技术曲线处理器模块存储器序列

系统为您推荐了相关专利信息

一种基于回环检测的相机二维运动目标跟踪方法及系统

跟踪方法卡尔曼滤波相机校正系统误差校正

一种水下非接触光通信方法、系统及存储介质

通信设备光斑中心坐标光通信方法通信光姿态估计算法

一种基于全景深相机的图像处理方法及相关设备

图像处理方法图像处理模型物体位置数据拍摄组件相机

训练神经网络用于基于视觉的跟踪的方法、装置和系统

关键点三维模型对象存储器设备检测器

基于多模态验证和时间戳加密的智能门锁系统及解锁方案

智能门锁系统主控芯片光通信模块动态密码存储模块

多智能体协同的多模态推理方法、装置、电子设备和产品

站点导航

APP 下载