摘要
本公开提供一种基于转换器模型的多尺度感知模型,包括:图像特征抽取网络,包括:由多级注意力模块堆叠而成的编码器,用于基于输入的待识别图像输出由所述多级注意力模块提取的多个图像块令牌(Patch Token)序列;特征融合网络,用于将所述多个图像块令牌序列进行融合,得到融合后的目标图像块令牌序列;以及至少一个卷积分类头网络,用于对所述目标图像块令牌序列进行目标识别,得到所述待识别图像中至少一个目标对象及其对应的识别结果。基于上述基于转换器模型的多尺度感知模型,本公开还提供了目标识别方法以及相关设备。
技术关键词
图像块
令牌
多尺度感知
特征融合网络
识别方法
序列
图像分类模型
转换器
注意力
卷积模块
计算机程序指令
编码器
计算机程序产品
线性
分类网络
系统为您推荐了相关专利信息
读数识别方法
迁移学习方法
表计
融合场景
识别模型训练
智能识别方法
应力
像素点
绘制三维模型
结构特征分析
情绪识别模型
影视剧
情绪特征
语音生成模型
音频特征
乳腺癌新辅助化疗疗效
染色
图像块特征
样本
组织