摘要
本公开提供一种基于自监督多尺度注意力学习的图像识别方法与系统,该方法包括:将输入图片输入ResNet进行处理,得到各个阶段的输出特征;将各个阶段中的预定目标阶段的输出特征输入到其对应的卷积块中处理,获得预定目标阶段的第一特征;将预定目标阶段的第一特征与各个阶段中的最终阶段的输出特征均输入到对应的注意力模块,处理获得对应的多尺度注意力图,并将其输入自监督多尺度注意力学习模块;根据预定目标阶段及最终阶段对应的多尺度注意力图及输出特征得到对应阶段的全局特征表示,并将预定目标阶段及最终阶段对应的全局特征输入相应的分类器获得预测类别的概率分布;根据预定目标阶段及最终阶段的预测类别的概率分布得到图片的最终预测类别。
技术关键词
预测类别
阶段
注意力
输出特征
图像识别方法
多尺度
图像识别系统
图片
分类器
模块
双线性
通道
系统为您推荐了相关专利信息
剪枝模型
跨模态
预测特征
输出特征
内容生成方法
梅尔频率倒谱系数
鉴别方法
融合特征
音频
声学特征
图像识别分类方法
图像分类器
空域特征
注意力机制
残差模块
优化预测模型
火灾预警方法
气体分析
表达式
隧道火灾预警系统