摘要
本申请属于遥感图像处理技术领域,为一种概率对齐无监督域适应遥感图像跨场景分类方法及系统,包括:将源域遥感图像数据集和目标域遥感图像数据集输入提示视觉编码器提取图像特征,根据源域遥感图像的类别构建包括类别的初始文本描述,并输入到提示文本编码器得到文本特征,计算每个图像特征与所有类别的文本特征之间的余弦相似度,转换为预测类别概率;根据预测类别概率构建类别概率矩阵,计算类别概率矩阵的核范数,并计算在源域上对类别概率矩阵的核范数的期望和目标域上对类别概率矩阵的核范数的期望的差异得到域差异,通过调整模型参数,使域差异最小化,克服了跨模态融合不足问题,能更充分地整合多模态信息。
技术关键词
文本编码器
遥感图像数据
场景分类方法
预测类别
无监督
视觉特征
注意力
矩阵
遥感图像处理技术
带标签
多模态信息
图像编码器
置信度阈值
参数
系统为您推荐了相关专利信息
光照特征
图像特征提取
图像语义分割方法
特征提取单元
特征提取网络
编码特征
大语言模型
对话生成方法
图像编码器
多尺度
大语言模型
信息处理方法
文本
语言模型训练方法
无监督