基于分流分解注意力的视觉Transformer分类方法

正文

推荐专利

申请号：CN202410900869

申请日期：2024-07-05

公开号：CN119027709A

公开日期：2024-11-26

类型：发明专利

摘要

本发明公开了基于分流分解注意力的视觉Transformer分类方法，本发明方法对PVT图像分类算法进行改进，在其基础上设计了更高效的分流分解注意力SDSA，提出将注意力分解为位置相关的局部注意力PWSA和稀疏全局的网格注意力GridSA，通过在局部注意力中加入位置信息，每个位置都能获得与自身依赖性最强的信息交互。将PWSA与GridSA进行串联，同时加入多分支的结构，能够在同一层中关注不同大小的感受野，更有利于对多尺度对象的识别，仅具有线性复杂度，能够同时建模局部细节和全局依赖关系。

技术关键词

分类方法前馈神经网络图像块图像分类算法网格视觉线性注意力机制多分支标签训练集矩阵复杂度参数支路模块对象

系统为您推荐了相关专利信息

一种呼吸道病原体标志物的识别方法以及应用

标志物识别方法图谱质谱联用技术数据

基于双摄像头实时视频拼接技术的C形臂可视定位系统

双摄像头拼接技术定位系统实时视频屏幕显示器

基于MOLDFLOW的汽车仪表塑料件成型DOE仿真分析方法

塑料件仿真分析方法汽车仪表三维模型注塑工艺

基于深度展开的仿射投影算法的超参数优化方法

仿射投影算法参数优化方法前馈神经网络深度网络模型传播算法

一种基于AI的阅卷图像智能采集系统、方法及终端设备

图像智能采集系统定位标记热力图网格 HSV色彩空间

基于分流分解注意力的视觉Transformer分类方法

站点导航

APP 下载