一种基于多模态大模型的问答方法、装置、设备及介质

正文

推荐专利

申请号：CN202511029688

申请日期：2025-07-25

公开号：CN120804380A

公开日期：2025-10-17

类型：发明专利

摘要

本申请公开了一种基于多模态大模型的问答方法、装置、设备及介质，涉及人工智能技术领域，包括：获取用户输入的目标图像和目标自然语言查询请求，并确定目标图像对应的视觉特征和目标自然语言查询请求对应的文本特征，以及基于视觉特征和文本特征确定相应的多模态融合特征；利用预先经过训练的目标大模型和预设智能代理，基于链式思维策略、预设工具集和多模态融合特征对目标自然语言查询请求对应的目标问题进行推理，得到相应的目标推理结果；基于目标推理结果生成候选回答，并确定候选回答对应的目标置信度，以及基于目标置信度和候选回答确定并输出目标问题对应的目标回答。本申请可以整合多模态信息与推理验证以提升问答的准确性和可靠性。

技术关键词

问答方法自然语言视觉特征融合特征置信度阈值图像输入接口多模态信息文本编码器策略问答装置存储计算机程序实体人工智能技术生成工具分析工具电子设备

系统为您推荐了相关专利信息

一种基于形式化方法的可信机器学习模型解释方法及装置

机器学习模型形式化方法特征值神经网络模型离散方法

一种基于差速分离的电力金具自动分拣系统及方法

电力金具输送带组件分拣系统分拣执行机构识别装置

一种面向大规模物品分类方法及系统

物品分类方法物品分类系统基准字段语义

一种胶合板缺陷检测系统及检测方法

动态反馈控制多模态传感器缺陷检测系统胶合板缺陷检测方法

源网运行风险监控预警方法及系统

随机森林模型时域特征频域特征监控预警方法训练特征

一种基于多模态大模型的问答方法、装置、设备及介质

站点导航

APP 下载