摘要
本发明涉及基于知识增强与非对称结构的遥感图像‑文本检索方法,属遥感图像‑文本跨模态检索技术领域。包括:将待检索的遥感图像和文本输入经过训练的知识增强与非对称结构的视觉‑语言基础模型中,通过模型处理实现跨模态检索;获取检索结果,得到遥感图像与文本的匹配检索输出,完成跨模态检索任务。本发明解决了目前遥感图像与文本模态间存在显著信息不对称性,导致检索性能受限的问题。本发明通过设计跨模态非对称柯尔莫哥洛夫‑阿诺德适配器微调方法,实现高效的模态细粒度共享特征学习;同时从ConceptNet和遥感知识图谱中提取知识,生成知识增强句子以丰富文本语义,从而弥合模态间的语义鸿沟,提升遥感图像‑文本检索性能。
技术关键词
非对称结构
文本检索方法
三元组
模态特征
注意力机制
语义特征
适配器
跨模态检索技术
生成知识
文本检索系统
遥感图像提取
图像视觉特征
知识图谱推理
系统为您推荐了相关专利信息
轨迹预测模型
车辆历史行驶轨迹
服务迁移方法
路段
Dijkstra算法
轻量化轴承
多尺度特征融合
特征提取模块
故障诊断模型
残差结构
多模态
传感器融合
权重分配机制
定位方法
信号特征
悬梁结构
施工监测方法
数字孪生模型
状态监测数据
计算机可执行指令