摘要
本发明涉及一种基于图像‑文本多模态特征融合的遥感图像语义分割方法,属于图像处理技术领域。先根据数据集地物类别名称构建文本提示,经过文本编码器获得文本特征,在训练阶段加上标签文件的文本提示;将遥感图像经过图像编码器获得图像特征和表示全局图像语义信息的向量;再将文本特征、图像特征和表示全局图像语义信息的向量经过TIFF模块实现文本‑图像特征之间的交互与融合;将融合特征输入分割头,得到最后的分割图,通过计算损失函数来优化训练上述分割模型。本发明显著提升了遥感图像语义分割的精度和鲁棒性,具有广泛的应用潜力。
技术关键词
多模态特征融合
文本编码器
地物类别
标签文本
融合特征
图像编码器
遥感图像语义分割
遥感图像预处理
标签文件
图像块
交叉注意力机制
上采样
图像处理技术
预测类别
系统为您推荐了相关专利信息
工业巡检
模态分析方法
深度学习算法
场景
多尺度特征融合
害虫图像识别方法
跨模态
蒸馏
文本编码器
图像编码器
耕地提取方法
图像分割模型
预训练模型
语义
影像