一种基于双模态变换和共识感知的遥感视觉问答方法

正文

推荐专利

申请号：CN202410963229

申请日期：2024-07-18

公开号：CN118885630B

公开日期：2025-01-07

类型：发明专利

摘要

本发明公开了一种基于双模态变换和共识感知的遥感视觉问答方法，包括：1、通过基于CLIP模型的图像以及文本特征提取网络得到图像以及文本特征表示；2、通过自注意力处理模块、共同注意机制模块获得具有视觉和文本表示内部及其之间的依赖关系的文本特征表示以及图片特征表示；3、构建基于图卷积神经网络的知识特征提取网络提取共现知识特征表示；4、通过特征融合网络得到综合表征特征；5、通过交叉熵损失函数以更新网络参数，以此训练得到最优匹配模型。本发明通过基于图卷积神经网络的知识特征提取网络提取共现知识特征表示，挖掘了深层次的文本知识，大大提高了文本信息的利用效率，从而大大提高了遥感视觉问答的准确率。

技术关键词

视觉问答方法答案特征提取网络文本注意力机制特征融合网络概念视觉问答模型双模态更新网络参数图像特征提取索引特征提取模块可读存储介质标签处理器

系统为您推荐了相关专利信息

基于数据增强与多特征融合的印章识别方法及装置

印章识别方法生成训练样本训练样本集注意力机制空洞

通用视觉目标定位方法、装置、电子设备及存储介质

查询特征跨模态定位方法解码模块特征提取模块

基于大模型的破产数据分析方法、设备及介质

数据分析方法专用数据库实体识别模型风险计算机可执行指令

基于大语言模型的对话摘要生成方法、装置、设备及存储介质

三元组摘要生成方法大语言模型数据元素

基于动态敏感词检测的电子文档安全管理系统

文档关键词电子摘要动态文本

一种基于双模态变换和共识感知的遥感视觉问答方法

站点导航

APP 下载