摘要
本发明公开了一种基于视觉标记的聚类与丢弃的遥感场景分类方法及装置,涉及遥感场景分类技术领域,该方法包括:构建遥感影像分类模型网络架构进行训练,以得到遥感影像分类模型;并将待分类的遥感影像输入至预训练好的遥感影像分类模型当中得到最终的分类结果;其中,遥感影像分类模型网络架构至少包括依次连接的多尺度特征提取与融合模块、特征增强聚合模块、Transformer模块,Transformer模块用于在接收到视觉标记,将视觉标记聚类为固定的簇,后将同一簇内的视觉标记合并为一个视觉标记,以根据视觉标记的重要程度将对应的视觉标记进行丢弃。本发明解决了现有技术中在进行遥感场景分类时计算复杂的问题。
技术关键词
遥感影像分类模型
遥感场景分类方法
视觉
标记
浅层特征提取
网络架构
全局平均池化
遥感场景分类技术
模块
颜色空间信息
局部空间特征
多尺度特征提取
多头注意力机制
通道
融合特征
频谱特征
处理器
矩阵