摘要
本申请适用于遥感图像技术领域,提供了一种遥感图像的预测方法、装置及终端设备,包括:将遥感图像的多个patch块输入至预设的Vit网络中进行特征编码,输出视觉特征向量和类别特征向量,将视觉特征向量输入至显著区域感知模块,生成显著区域特征向量,将类别特征向量输入至多实例学习模块,生成标签概率分布,再结合区域注意力机制和显著区域特征向量,生成视觉注意力上下文特征向量,结合标签注意力机制和标签概率分布,生成语义注意力上下文特征向量,最后将视觉注意力上下文特征向量和语义注意力上下文特征向量进行融合,生成融合特征并生成遥感图像的预测结果。由此可以提高遥感图像预测分类的准确性。
技术关键词
语义注意力
视觉
融合特征
生成标签
生成遥感图像
遥感图像技术
定位模块
单层
终端设备
多头注意力机制
矩阵
多实例
预测装置
网络
处理器