摘要
本申请提供了一种基于多模态多尺度自适应数据融合的遥感大模型性能提升方法,涉及遥感图像大语言模型技术领域。该方法基于开源的视觉通用语言模型重新改写网络结构,通过加入用于实现多模态融合和多尺度自适应的MFAM‑SPP层,得到性能提升的遥感大模型,并明确ViT、MFAM‑SPP、BERT、Q‑Former间的数据流与维度转换逻辑,在不过多降低速度的情况下,提升对多模态处理能力和多尺度目标检测能力,对整体模型的精度大幅提升。
技术关键词
多模态
遥感图像数据
性能提升方法
跨模态
文本特征向量
三通道
注意力
矩阵
筛选系统
多尺度
融合特征
轻量级卷积神经网络
动态
视觉
性能提升装置
池化特征
模态特征
空间结构特征
系统为您推荐了相关专利信息
故障预测方法
煤矿设备
裂纹扩展速率
电化学噪声
预警机制
动态监测方法
传感器节点
管道本体
频谱特征
管道壁厚
模型迁移方法
视觉特征
多模态
图像生成模型
基础