多模态与视觉大模型耦合的遥感语义分割方法及产品

AITNT
正文
推荐专利
多模态与视觉大模型耦合的遥感语义分割方法及产品
申请号:CN202511049186
申请日期:2025-07-29
公开号:CN120823470A
公开日期:2025-10-21
类型:发明专利
摘要
本发明提供了多模态与视觉大模型耦合的遥感语义分割方法及产品,涉及遥感图像处理技术领域。本发明实施例不再将额外模态视为与视觉大模型原生模态(RGB图像)平等的输入,而是作为主模态的提示。具体来说,将多模态数据视为具有不同遥感属性的提示后,即可动态地根据具体下游任务注入期望模态的感知维度并给出相应的分割结果。本发明实施例利用混合专家模型机制构建了多模态提示器,在提取多模态特征的同时稀疏化模型结构,控制计算负载。
技术关键词
语义分割方法 图像编码器 语义分割模型 图像嵌入 多模态特征 视觉 解码器 互补特征 遥感图像处理技术 网络 提示器 小型适配器 数据 处理器 特征提取器 微调方法 矩阵 通道
系统为您推荐了相关专利信息
1
模型训练方法、电子设备及计算机可读存储介质
多模态 模型训练方法 文本编码器 图像编码器 数据处理方法
2
图像获取的方法、装置及相关设备
三维人体模型 图像 纹理 服饰 三维人体建模
3
一种医学影像的分割方法、系统及装置
医学影像数据 图像编码 适配器 上下文特征 图像嵌入
4
一种多源异构数据融合的知识图谱方法及系统
多源异构数据融合 双向长短期记忆网络 矩阵 命名实体模型 融合时空特征
5
跨模态对齐的图像文本匹配方法、装置、设备及介质
图像文本匹配模型 文本编码器 文本匹配方法 图像编码器 交叉注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号