摘要
本发明提供了一种循环增强视觉‑文本跨模态注意力表征方法。本发明的目的在于提供一种视觉‑文本跨模态注意力表征方法,旨在加强视觉‑文本关联,降低视觉‑文本双模态间的特征差异。通过迭代多级视觉‑文本融合模块、基于掩码参考的中心点监督模块和循环增强解码器模块统一研究视觉文本融合。本发明能够充分利用文本信息,获得更全面、更细节的文本嵌入,并增强图像的上下文理解,通过循环增强融合与文本特征最相关的视觉目标。本发明的方法具有广泛的应用前景,可应用于视觉文本融合和遥感图像处理等领域,为视觉‑文本跨模态特征表征提供了一种有效的解决方案。
技术关键词
文本
表征方法
跨模态
视觉特征提取
解码器
对齐模块
遥感图像处理
多头注意力机制
融合特征
语义
上下文特征
判别特征
对象
阶段
网络架构
系统为您推荐了相关专利信息
联合特征提取
跨模态
Apriori算法
多源异构数据融合
可视化控制台
随机噪声
生成对抗网络
多源异构数据
时间序列形式
重构
诊断辅助方法
多模态
数据知识库
答案
计算机可执行指令
显示文本信息
采集管理方法
编码向量
自然语言
图像