摘要
本发明涉及遥感图像变化检测领域,公开了一种基于语言引导的遥感图像变化检测方法。采用Efficient SAM作为视觉基础模型,提取两时相的遥感图像语义特征图,构建多层适配器,提取两时相多尺度特征图;构建空间注意力,提取视觉特征;通过文本编码器处理输入的文本描述,得到词嵌入以及总体表达嵌入;采用多头交叉注意力的方法,构建预融合模块,用于词嵌入和拼接后多层特征图的融合操作;构建双通道解码器结构,将获得的图像特征与语义嵌入进行相似度计算,输出最终的变化检测掩码。本发明通过设计多层的视觉‑语言特征交叉层,使模型充分学习图像与对应类型文本的相关信息,实现以自然语言为引导,能够对多类别遥感图像变化的通用检测。
技术关键词
视觉特征
遥感图像变化检测
语义特征
文本编码器
交叉注意力机制
金字塔结构
解码器结构
多尺度特征学习
融合多模态信息
自然语言模型
适配器
代表
系统为您推荐了相关专利信息
图像修复方法
级联
卷积解码器
卷积编码器
注意力
报告生成方法
生成智能
多模态
影像
深度学习回归模型