摘要
本发明公开了基于分流分解注意力的视觉Transformer分类方法,本发明方法对PVT图像分类算法进行改进,在其基础上设计了更高效的分流分解注意力SDSA,提出将注意力分解为位置相关的局部注意力PWSA和稀疏全局的网格注意力GridSA,通过在局部注意力中加入位置信息,每个位置都能获得与自身依赖性最强的信息交互。将PWSA与GridSA进行串联,同时加入多分支的结构,能够在同一层中关注不同大小的感受野,更有利于对多尺度对象的识别,仅具有线性复杂度,能够同时建模局部细节和全局依赖关系。
技术关键词
分类方法
前馈神经网络
图像块
图像分类算法
网格
视觉
线性
注意力机制
多分支
标签
训练集
矩阵
复杂度
参数
支路
模块
对象
系统为您推荐了相关专利信息
双摄像头
拼接技术
定位系统
实时视频
屏幕显示器
塑料件
仿真分析方法
汽车仪表
三维模型
注塑工艺
仿射投影算法
参数优化方法
前馈神经网络
深度网络模型
传播算法
图像智能采集系统
定位标记
热力图
网格
HSV色彩空间