基于图像-文本多模态特征融合的遥感图像语义分割方法

AITNT
正文
推荐专利
基于图像-文本多模态特征融合的遥感图像语义分割方法
申请号:CN202510734933
申请日期:2025-06-04
公开号:CN120510385A
公开日期:2025-08-19
类型:发明专利
摘要
本发明涉及一种基于图像‑文本多模态特征融合的遥感图像语义分割方法,属于图像处理技术领域。先根据数据集地物类别名称构建文本提示,经过文本编码器获得文本特征,在训练阶段加上标签文件的文本提示;将遥感图像经过图像编码器获得图像特征和表示全局图像语义信息的向量;再将文本特征、图像特征和表示全局图像语义信息的向量经过TIFF模块实现文本‑图像特征之间的交互与融合;将融合特征输入分割头,得到最后的分割图,通过计算损失函数来优化训练上述分割模型。本发明显著提升了遥感图像语义分割的精度和鲁棒性,具有广泛的应用潜力。
技术关键词
多模态特征融合 文本编码器 地物类别 标签文本 融合特征 图像编码器 遥感图像语义分割 遥感图像预处理 标签文件 图像块 交叉注意力机制 上采样 图像处理技术 预测类别
系统为您推荐了相关专利信息
1
一种工业巡检场景的多模态分析方法、系统、设备及介质
工业巡检 模态分析方法 深度学习算法 场景 多尺度特征融合
2
一种基于跨模态知识蒸馏的细粒度害虫图像识别方法
害虫图像识别方法 跨模态 蒸馏 文本编码器 图像编码器
3
跨域耕地提取方法、装置、设备、存储介质及程序产品
耕地提取方法 图像分割模型 预训练模型 语义 影像
4
基于分支结构模型的位姿估计方法、装置、设备及介质
估计方法 融合特征 分支 关键点 视觉特征提取
5
一种多维度协同决策方法及系统
决策方法 大语言模型 轨迹 模板 风格
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号