摘要
本发明属于图像检索领域,具体涉及一种基于多尺度跨模态的卫星遥感影像图文检索方法、系统、终端及介质,构建多源多尺度跨模态遥感影像语义理解模型;使用多源多尺度跨模态遥感影像语义理解模型对若干源卫星遥感影像进行处理,获得源卫星遥感影像的源特征向量;将源特征向量储存到向量库;使用多源多尺度跨模态遥感影像语义理解模型对输入的图像检索信息或文本检索信息进行处理,获得图像检索特征向量或文本检索特征向量;将图像检索特征向量或文本检索特征向量与向量库中的源特征向量进行相似度比对,筛选出目标源卫星遥感影像。本发明提高文本和影像特征的鲁棒性,构建针对多源数据特征的统一存储及管理载体,提高管理效率、检索精度和效率。
技术关键词
卫星遥感影像
语义理解模型
图文检索方法
跨模态
多尺度
Kmeans聚类方法
预训练模型
文本编码器
大语言模型
图像编码器
数据
多模态
文本特征向量
图像特征向量
图像块
可读存储介质
系统为您推荐了相关专利信息
视觉特征
协同注意力
知识点标签
知识点标注方法
多模态
特征金字塔网络
通道注意力机制
检测头结构
抑制算法
交通流
多模态融合方法
多分辨率
无人机
交叉注意力机制
图像