摘要
本发明提供一种基于多模态的无监督域适应高光谱图像分类方法及系统。本发明方法,包括:通过图像编码器提取全局特征,使用双分类器对图像样本进行分类,对齐源域与目标域同类的分布,并为目标域生成伪标签;通过文本编码器提取文本特征,将文本特征和图像特征进行对比学习,拉近同类别的文本、图像特征间的距离,提升数据的可分离性。本发明系统,包括域适应模块和视觉‑语言对齐模块,其中:域适应模块由图像编码器得到图像特征,由双分类器得到预测结果,并选择其中一个预测结果作为目标域伪标签;视觉‑语言对齐模块利用源域标签和目标域伪标签得到相应文本描述,在由文本编码器得到文本特征后,文本特征与域适应部分得到的图像特征进行对齐。
技术关键词
图像编码器
多模态
文本编码器
对齐模块
高光谱图像分类系统
标签
样本
注意力
更新分类器
视觉
支路
数据
指标
参数
系统为您推荐了相关专利信息
智能驾驶系统
障碍物
双目立体相机
云端管理平台
多模态传感器
光学邻近效应修正方法
掩模图案
光学邻近效应修正系统
成像误差
策略
防抱死制动方法
液压控制单元
ABS控制单元
防抱死制动系统
PID控制策略
仿生机器人
发声系统
振动激励器
人体鼻腔
传感器