一种循环增强视觉-文本跨模态注意力表征方法

AITNT
正文
推荐专利
一种循环增强视觉-文本跨模态注意力表征方法
申请号:CN202411572866
申请日期:2024-11-05
公开号:CN119598390A
公开日期:2025-03-11
类型:发明专利
摘要
本发明提供了一种循环增强视觉‑文本跨模态注意力表征方法。本发明的目的在于提供一种视觉‑文本跨模态注意力表征方法,旨在加强视觉‑文本关联,降低视觉‑文本双模态间的特征差异。通过迭代多级视觉‑文本融合模块、基于掩码参考的中心点监督模块和循环增强解码器模块统一研究视觉文本融合。本发明能够充分利用文本信息,获得更全面、更细节的文本嵌入,并增强图像的上下文理解,通过循环增强融合与文本特征最相关的视觉目标。本发明的方法具有广泛的应用前景,可应用于视觉文本融合和遥感图像处理等领域,为视觉‑文本跨模态特征表征提供了一种有效的解决方案。
技术关键词
文本 表征方法 跨模态 视觉特征提取 解码器 对齐模块 遥感图像处理 多头注意力机制 融合特征 语义 上下文特征 判别特征 对象 阶段 网络架构
系统为您推荐了相关专利信息
1
一种面向复杂场景的端到端语义提取系统
联合特征提取 跨模态 Apriori算法 多源异构数据融合 可视化控制台
2
基于多智能体协作的访谈对话式信息推送方法及相关装置
观点 主题 感兴趣 多智能体协作 信息推送方法
3
一种面向事件信息推演的数据增强方法
随机噪声 生成对抗网络 多源异构数据 时间序列形式 重构
4
基于多模态检索增强生成的慢性病诊断辅助方法及系统
诊断辅助方法 多模态 数据知识库 答案 计算机可执行指令
5
基于图像识别的新媒体素材内容采集管理方法及系统
显示文本信息 采集管理方法 编码向量 自然语言 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号