摘要
本发明公开了一种面向多尺度遥感影像的地表覆盖分类模型,包括ViT编码器、低秩微调模块、CNN编码器、解码器、尺度编码器、以及位置编码器;多分辨率遥感影像经ViT编码器块编码层处理后进入Transformer层,再与CNN编码器处理后的CNN特征进行交互融合,融合后的视觉特征与尺度编码、位置编码通过注意力机制融合后进入解码器,解码器经多步操作得到每个像素对应的类别概率,最后由语义分割头确定地物类别。本发明实现了单模型跨分辨率自动解译,支持2到10米分辨率遥感影像多要素地物分类。引入视觉预训练大模型提升解译稳定性;并通过ViT和CNN双分支兼顾全局上下文和局部细节信息;且在解码过程中引入语义对齐上采样,提升分割精准性。
技术关键词
多分辨率遥感影像
地表覆盖分类
上采样
视觉特征
金字塔池化模块
位置编码器
解码器
地物类别
多尺度
双向注意力机制
语义
分块
交叉注意力机制
系统为您推荐了相关专利信息
户外隔离开关
故障识别系统
输入模块
图像
输出模块
特征提取模型
深层特征提取
二维离散小波变换
浅层特征提取
残差模块
离散余弦变换系数
像素块
视觉
文本
前馈神经网络