多模态与视觉大模型耦合的遥感语义分割方法及产品

正文

推荐专利

申请号：CN202511049186

申请日期：2025-07-29

公开号：CN120823470A

公开日期：2025-10-21

类型：发明专利

摘要

本发明提供了多模态与视觉大模型耦合的遥感语义分割方法及产品，涉及遥感图像处理技术领域。本发明实施例不再将额外模态视为与视觉大模型原生模态(RGB图像)平等的输入，而是作为主模态的提示。具体来说，将多模态数据视为具有不同遥感属性的提示后，即可动态地根据具体下游任务注入期望模态的感知维度并给出相应的分割结果。本发明实施例利用混合专家模型机制构建了多模态提示器，在提取多模态特征的同时稀疏化模型结构，控制计算负载。

技术关键词

语义分割方法图像编码器语义分割模型图像嵌入多模态特征视觉解码器互补特征遥感图像处理技术网络提示器小型适配器数据处理器特征提取器微调方法矩阵通道

系统为您推荐了相关专利信息

模型训练方法、电子设备及计算机可读存储介质

多模态模型训练方法文本编码器图像编码器数据处理方法

图像获取的方法、装置及相关设备

三维人体模型图像纹理服饰三维人体建模

一种医学影像的分割方法、系统及装置

医学影像数据图像编码适配器上下文特征图像嵌入

一种多源异构数据融合的知识图谱方法及系统

多源异构数据融合双向长短期记忆网络矩阵命名实体模型融合时空特征

跨模态对齐的图像文本匹配方法、装置、设备及介质

图像文本匹配模型文本编码器文本匹配方法图像编码器交叉注意力机制

多模态与视觉大模型耦合的遥感语义分割方法及产品

站点导航

APP 下载