基于转换器模型的多尺度感知模型、目标识别方法及相关设备

AITNT
正文
推荐专利
基于转换器模型的多尺度感知模型、目标识别方法及相关设备
申请号:CN202410797020
申请日期:2024-06-19
公开号:CN118628823B
公开日期:2025-09-09
类型:发明专利
摘要
本公开提供一种基于转换器模型的多尺度感知模型,包括:图像特征抽取网络,包括:由多级注意力模块堆叠而成的编码器,用于基于输入的待识别图像输出由所述多级注意力模块提取的多个图像块令牌(Patch Token)序列;特征融合网络,用于将所述多个图像块令牌序列进行融合,得到融合后的目标图像块令牌序列;以及至少一个卷积分类头网络,用于对所述目标图像块令牌序列进行目标识别,得到所述待识别图像中至少一个目标对象及其对应的识别结果。基于上述基于转换器模型的多尺度感知模型,本公开还提供了目标识别方法以及相关设备。
技术关键词
图像块 令牌 多尺度感知 特征融合网络 识别方法 序列 图像分类模型 转换器 注意力 卷积模块 计算机程序指令 编码器 计算机程序产品 线性 分类网络
系统为您推荐了相关专利信息
1
基于迁移学习增强的光伏升压站表计读数识别方法、系统及产品
读数识别方法 迁移学习方法 表计 融合场景 识别模型训练
2
一种骨质疏松区域智能识别方法及其系统
智能识别方法 应力 像素点 绘制三维模型 结构特征分析
3
配电网络的触电故障识别方法、装置及设备
配电网络 参数 融合特征 矩阵 注意力
4
一种影视剧配音中的情绪识别方法及装置
情绪识别模型 影视剧 情绪特征 语音生成模型 音频特征
5
一种乳腺癌新辅助化疗疗效预测方法及系统
乳腺癌新辅助化疗疗效 染色 图像块特征 样本 组织
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号