摘要
本发明公开了一种基于视觉语言模型的遥感图像目标识别方法及系统,涉及图像识别技术领域。该方法包括:基于实时开放词汇检测器YOLO‑World和遥感视觉语言基础模型RemoteCLIP构建初始图像检测模型;在初始图像检测模型上加入双注意融合编码器和多级文本引导融合解码器,以得到目标图像检测模型;在目标图像检测模型的预训练权重基础上进行知识自适应调优,以得到最终的图像目标识别模型;基于图像目标识别模型对遥感图像进行目标识别。本发明通过引入强大的视觉语言模型,优化图像特征提取和目标分类策略,从而提高遥感图像中目标识别的准确性和效率。
技术关键词
图像检测模型
识别方法
文本编码器
视觉
检测器
解码器
基础
文本编辑器
图像特征提取
图像识别技术
识别模块
分类策略
适配器
识别系统
处理器
多层次