多智能体协同的多模态推理方法、装置、电子设备和产品

AITNT
正文
推荐专利
多智能体协同的多模态推理方法、装置、电子设备和产品
申请号:CN202511251609
申请日期:2025-09-03
公开号:CN120725166A
公开日期:2025-09-30
类型:发明专利
摘要
本申请涉及人工智能技术领域,提出一种多智能体协同的多模态推理方法、装置、电子设备和计算机程序产品。该方法设置了文本推理智能体、视觉理解智能体和判断型智能体共三个智能体,其中,文本推理智能体主导整体的文本逻辑推理,视觉理解智能体负责提供视觉语义信息,判断型智能体负责评估多模态推理的过程是否需要补充额外的视觉语义信息,并在需要补充的情况下触发视觉信息补充流程,引导视觉理解智能体提取所需补充的视觉语义信息。利用三个智能体的协同工作,形成了多模态推理、补充判断和信息补充的闭环机制,在无需执行复杂预处理流程的基础上,能够对多模态文档进行深度语义理解和逻辑推理,从而实现准确、完整的文档理解与答复文本生成。
技术关键词
多模态 视觉 文本 图像 多智能体协同 推理方法 语义 缓存页面 计算机程序产品 电子设备 列表 指令 推理装置 人工智能技术 曲线 处理器 模块 存储器 序列
系统为您推荐了相关专利信息
1
一种基于回环检测的相机二维运动目标跟踪方法及系统
跟踪方法 卡尔曼滤波 相机 校正系统 误差校正
2
一种水下非接触光通信方法、系统及存储介质
通信设备 光斑中心坐标 光通信方法 通信光 姿态估计算法
3
一种基于全景深相机的图像处理方法及相关设备
图像处理方法 图像处理模型 物体位置数据 拍摄组件 相机
4
训练神经网络用于基于视觉的跟踪的方法、装置和系统
关键点 三维模型 对象 存储器设备 检测器
5
基于多模态验证和时间戳加密的智能门锁系统及解锁方案
智能门锁系统 主控芯片 光通信模块 动态密码 存储模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号