摘要
本申请实施例提供了一种图像识别方法、设备和存储介质,可以应用于高分辨率医学图像识别任务中,该方法包括通过大规模预训练模型中的N个Transformer模块获得待识别图像的N个中间图特征序列,然后将N个中间图特征序列对应输入侧融合网络模型的N个融合模块,并向输入侧融合网络模型输入提示向量,以通过提示向量帮助融合模块理解和处理中间图特征序列,进而通过N个融合模块输出待识别图像的目标图特征序列,最终基于目标图特征序列获得待识别图像的识别结果。本方案在训练阶段可以冻结大规模预训练模型的参数,只对侧融合网络模型以及提示向量进行参数更新,从而减少了训练阶段的资源消耗,有助于在训练过程中提升模型在处理高分辨率图像方面的能力。
技术关键词
预训练模型
序列
注意力
图像识别方法
分类网络
计算机可执行指令
样本
标记
识别标签
编码模块
图像识别装置
参数
存储器
处理器
计算机设备
可读存储介质
程序
系统为您推荐了相关专利信息
红外热成像技术
图像识别方法
语义
图像像素
红外成像仪
多尺度滤波
样本生成方法
纹理
损失函数优化
物理
车辆位姿估计方法
注意力
汽车摄像头
全局特征融合
汽车模型