融合上下文学习与链式推理的视觉语言推理方法及系统

正文

推荐专利

申请号：CN202510661708

申请日期：2025-05-22

公开号：CN120654809A

公开日期：2025-09-16

类型：发明专利

摘要

本发明属于人工智能技术领域，具体涉及一种融合上下文学习与链式推理的视觉语言推理方法及系统，方法分两个阶段来进行多模态推理，在第一阶段，结合上下文示例和目标问题识别目标图像的ROI区域；在第二阶段，将目标图像的全局特征和ROI区域、上下文示例的全局特征和ROI特征、目标问题相结合，预测得到最终的文本答案。本发明实现了局部特征提取以及局部特征与全局特征的融合，并结合上下文示例进行阶段性的视觉语言推理，能够提高视觉语言任务的逻辑推理能力和鲁棒性。

技术关键词

局部视觉特征图像融合全局推理方法推理系统文本答案样本编码语义模型训练模块参数局部特征提取网络数据人工智能技术多模态鲁棒性

系统为您推荐了相关专利信息

一种无人机航拍三维建模计算工程量的方法

无人机三维模型三维点云数据航拍图像边缘检测方法

基于数据融合的水浴振荡器运行监控系统及方法

水浴振荡器样品管深度学习预测模型监控方法变量

基于区块链的科技成果真实性验证与评价平台

真实性验证评价平台关键词图像识别技术分析文档内容

一种碳纤维扫描电子显微镜截面图像自动识别方法及系统

图像自动识别方法扫描电子显微镜残差神经网络神经网络模型图像自动识别系统

一种类激活映射图生成方法、装置、设备及其存储介质

像素点图像特征提取特征提取模型生成方法聚类

融合上下文学习与链式推理的视觉语言推理方法及系统

站点导航

APP 下载