摘要
本发明提出了一种基于超分辨率Transformer的汽车零部件检测方法,涉及图像识别技术领域。本发明提出了车辆零部件检测流程,包括卷积层,注意力层和上采样卷积模块,注意力层包括Transformer模块,Transformer模块包括跨模态注意力模块和类别‑内容多头注意力模块,同时提出跨模态注意力CMA和类别‑内容多头注意力模块CCMSA,跨模态注意力CMA关注不同模态之间的关联,可以有效的融合来自不同模态的信息,类别‑内容多头注意力模块CCMSA能够利用相距较远但相似的token来增强输入特征,并在每个类别中进行关注,再进行内容分类,超越了局部窗口的限制。
技术关键词
汽车零部件
跨模态
超分辨率
卷积模块
多头注意力机制
车辆零部件
图像识别技术
像素
内容分类
模态特征
标签
上采样
洗牌
轮辋
焊缝
数据
系统为您推荐了相关专利信息
模态检索方法
多模态
样本
文本特征向量
图像特征向量
校园
判断方法
关键词
音频编辑软件
多头注意力机制
抽象语法树
控制单元
自然语言
多头注意力机制
文本
文本
注意力机制
生成方法系统
解码器
前馈神经网络
模型训练方法
深度学习模型
图像
注意力
非易失性存储介质