摘要
本申请涉及一种基于多源遥感影像的视觉大模型构建方法、装置、设备及介质,方法包括:针对光学遥感影像、SAR遥感影像与红外遥感影像像特征差异大、模型跨源泛化性弱的问题,研究基于多源遥感影像的视觉大模型,通过融合多模态数据互补特征,建立跨源目标统一表征空间,解决单一模型对不同影像源特征适应性不足的瓶颈,重点挖掘多源影像中目标纹理、几何与辐射特性的关联性,设计多层级特征交互与自适应融合机制,增强模型对跨源目标的语义一致性理解,最终构建具备强泛化能力的视觉大模型,为星上轻量化小模型提供高精度监督信号,确保跨源遥感影像目标检测性能的稳定性。本申请能够降低对目标域标注数据的依赖,使模型保持良好的泛化能力。
技术关键词
光学遥感影像
红外遥感影像
雷达遥感影像
多源遥感影像
局部细节特征
模型构建方法
交叉注意力机制
对象
重构
视觉
编码器
语义
融合特征
特征提取网络
SAR遥感影像
多源融合
掩码矩阵
识别头
系统为您推荐了相关专利信息
统一身份认证平台
指纹模板
加权融合算法
指数加权移动平均值
二进制数据形式
语义场景
建筑识别方法
样本
建筑物轮廓
语义分割网络
高分遥感影像
特征金字塔网络
多实例
高分辨率遥感影像
标签
特征提取模型
篡改检测方法
图片
局部细节特征
数据收集方法
多任务卷积神经网络
图像训练样本
局部细节特征
识别模型训练
结构特征提取