基于图像-文本多模态特征融合的遥感图像语义分割方法

正文

推荐专利

申请号：CN202510734933

申请日期：2025-06-04

公开号：CN120510385A

公开日期：2025-08-19

类型：发明专利

摘要

本发明涉及一种基于图像‑文本多模态特征融合的遥感图像语义分割方法，属于图像处理技术领域。先根据数据集地物类别名称构建文本提示，经过文本编码器获得文本特征，在训练阶段加上标签文件的文本提示；将遥感图像经过图像编码器获得图像特征和表示全局图像语义信息的向量；再将文本特征、图像特征和表示全局图像语义信息的向量经过TIFF模块实现文本‑图像特征之间的交互与融合；将融合特征输入分割头，得到最后的分割图，通过计算损失函数来优化训练上述分割模型。本发明显著提升了遥感图像语义分割的精度和鲁棒性，具有广泛的应用潜力。

技术关键词

多模态特征融合文本编码器地物类别标签文本融合特征图像编码器遥感图像语义分割遥感图像预处理标签文件图像块交叉注意力机制上采样图像处理技术预测类别

系统为您推荐了相关专利信息

一种工业巡检场景的多模态分析方法、系统、设备及介质

工业巡检模态分析方法深度学习算法场景多尺度特征融合

一种基于跨模态知识蒸馏的细粒度害虫图像识别方法

害虫图像识别方法跨模态蒸馏文本编码器图像编码器

跨域耕地提取方法、装置、设备、存储介质及程序产品

耕地提取方法图像分割模型预训练模型语义影像

基于分支结构模型的位姿估计方法、装置、设备及介质

估计方法融合特征分支关键点视觉特征提取

一种多维度协同决策方法及系统

决策方法大语言模型轨迹模板风格

基于图像-文本多模态特征融合的遥感图像语义分割方法

站点导航

APP 下载