摘要
本发明涉及一种域判别注意增强的视觉语言遥感场景分类方法,所述方法包括以下步骤:选择与处理遥感场景分类数据集、构建域判别注意增强空间状态嵌入网络、训练域判别注意增强空间状态嵌入网络、对域判别注意增强空间状态嵌入网络进行测试。与现有技术相比,域判别注意增强模块能够根据目标域特征动态地调整源域特征的权重,使得目标域特征能够聚焦于源域中最有价值的信息;使用对比语言图像预训练CLIP模型的编码器,可以通过与自然语言描述的关联,利用其在大规模数据中学习到的相关知识来进行判断,从而增强了网络在不同场景下的泛化能力,同时空间状态嵌入模块构建更丰富特征表示,使模型捕捉到两种模态交互关系,挖掘潜在信息。
技术关键词
遥感场景分类方法
文本编码器
图像编码器
模态特征
注意力
矩阵
更新网络参数
标签
状态空间模型
输出特征
多层感知机
模块
数据
模型预训练
视觉