摘要
本发明公开了基于多模态域泛化的跨场景高光谱图像分类方法,包括以下步骤:步骤一,数据准备;步骤二,图像特征提取;步骤三,构建优化语义空间;步骤四,计算损失并优化模型;步骤五,模型测试;本发明利用多模态融合网络实现对分类算法的优化,该网络将两个特征提取模块协同并行运作,能够挖掘出更为丰富多元的图像特征;通过处理每个类别的先验文本知识来构建优化语义空间,使得图像特征得以按类别精准对齐,进而显著提升了分类的准确性;优化语义空间实现了图像与文本两种模态的深度交互融合,推动跨域不变表征的学习,并且通过针对性优化有监督的对比损失,促使特征在语义空间内按类对齐,进一步减少跨域差异,增强模型的适应性与稳定性。
技术关键词
图像编码器
多模态
残差模块
语义
文本编码器
图像特征提取
场景
残差金字塔
注意力
前馈神经网络
矩阵
图像块
多尺度特征
特征提取模块
系统为您推荐了相关专利信息
高维特征向量
生成对抗网络
语义向量
雷达传感器
数据
舆情分析方法
模态特征
文本
多尺度特征融合
多头注意力机制
语义特征
机器可读程序
指标
自然语言理解
语句主题
多模态传感器
决策支持数据
数据交互单元
核查系统
监控模块