基于自监督多尺度注意力学习的图像识别方法与系统

正文

推荐专利

申请号：CN202411690276

申请日期：2024-11-25

公开号：CN119649099A

公开日期：2025-03-18

类型：发明专利

摘要

本公开提供一种基于自监督多尺度注意力学习的图像识别方法与系统，该方法包括：将输入图片输入ResNet进行处理，得到各个阶段的输出特征；将各个阶段中的预定目标阶段的输出特征输入到其对应的卷积块中处理，获得预定目标阶段的第一特征；将预定目标阶段的第一特征与各个阶段中的最终阶段的输出特征均输入到对应的注意力模块，处理获得对应的多尺度注意力图，并将其输入自监督多尺度注意力学习模块；根据预定目标阶段及最终阶段对应的多尺度注意力图及输出特征得到对应阶段的全局特征表示，并将预定目标阶段及最终阶段对应的全局特征输入相应的分类器获得预测类别的概率分布；根据预定目标阶段及最终阶段的预测类别的概率分布得到图片的最终预测类别。

技术关键词

预测类别阶段注意力输出特征图像识别方法多尺度图像识别系统图片分类器模块双线性通道

系统为您推荐了相关专利信息

基于rag检索的低资源约束的医学术语标准化处理方法

术语标准化预训练模型医学字符资源

跨模态生成模型训练和内容生成方法、装置和设备

剪枝模型跨模态预测特征输出特征内容生成方法

基于小样本学习的多域声学特征融合的伪造音频鉴别方法和计算装置

梅尔频率倒谱系数鉴别方法融合特征音频声学特征

基于频域辅助深度学习的水下图像识别分类方法及系统

图像识别分类方法图像分类器空域特征注意力机制残差模块

一种基于气体分析的隧道火灾预警方法及系统

优化预测模型火灾预警方法气体分析表达式隧道火灾预警系统

基于自监督多尺度注意力学习的图像识别方法与系统

站点导航

APP 下载