摘要
本发明提供了多模态与视觉大模型耦合的遥感语义分割方法及产品,涉及遥感图像处理技术领域。本发明实施例不再将额外模态视为与视觉大模型原生模态(RGB图像)平等的输入,而是作为主模态的提示。具体来说,将多模态数据视为具有不同遥感属性的提示后,即可动态地根据具体下游任务注入期望模态的感知维度并给出相应的分割结果。本发明实施例利用混合专家模型机制构建了多模态提示器,在提取多模态特征的同时稀疏化模型结构,控制计算负载。
技术关键词
语义分割方法
图像编码器
语义分割模型
图像嵌入
多模态特征
视觉
解码器
互补特征
遥感图像处理技术
网络
提示器
小型适配器
数据
处理器
特征提取器
微调方法
矩阵
通道
系统为您推荐了相关专利信息
多模态
模型训练方法
文本编码器
图像编码器
数据处理方法
医学影像数据
图像编码
适配器
上下文特征
图像嵌入
多源异构数据融合
双向长短期记忆网络
矩阵
命名实体模型
融合时空特征
图像文本匹配模型
文本编码器
文本匹配方法
图像编码器
交叉注意力机制