基于转换器模型的多尺度感知模型、目标识别方法及相关设备

正文

推荐专利

申请号：CN202410797020

申请日期：2024-06-19

公开号：CN118628823B

公开日期：2025-09-09

类型：发明专利

摘要

本公开提供一种基于转换器模型的多尺度感知模型，包括：图像特征抽取网络，包括：由多级注意力模块堆叠而成的编码器，用于基于输入的待识别图像输出由所述多级注意力模块提取的多个图像块令牌(Patch Token)序列；特征融合网络，用于将所述多个图像块令牌序列进行融合，得到融合后的目标图像块令牌序列；以及至少一个卷积分类头网络，用于对所述目标图像块令牌序列进行目标识别，得到所述待识别图像中至少一个目标对象及其对应的识别结果。基于上述基于转换器模型的多尺度感知模型，本公开还提供了目标识别方法以及相关设备。

技术关键词

图像块令牌多尺度感知特征融合网络识别方法序列图像分类模型转换器注意力卷积模块计算机程序指令编码器计算机程序产品线性分类网络

系统为您推荐了相关专利信息

基于迁移学习增强的光伏升压站表计读数识别方法、系统及产品

读数识别方法迁移学习方法表计融合场景识别模型训练

一种骨质疏松区域智能识别方法及其系统

智能识别方法应力像素点绘制三维模型结构特征分析

配电网络的触电故障识别方法、装置及设备

配电网络参数融合特征矩阵注意力

一种影视剧配音中的情绪识别方法及装置

情绪识别模型影视剧情绪特征语音生成模型音频特征

一种乳腺癌新辅助化疗疗效预测方法及系统

乳腺癌新辅助化疗疗效染色图像块特征样本组织

基于转换器模型的多尺度感知模型、目标识别方法及相关设备

站点导航

APP 下载