摘要
本发明公开了基于轻量化空间缩减注意力的视觉Transformer分类方法,该方法将多头注意力划分为两组进行不同程度的下采样以关注不同大小的对象,并提出了一种软分割下采样模块代替空间缩减注意力中的卷积层,接着使用深度可分离卷积代替软分割下采样模块中的普通卷积,进一步减少参数量,最后对具有不同下采样率分支进行通道重要性评估。使用轻量化空间缩减注意力的LightPVT降低约30%的参数量,且模型的性能得到了提升。
技术关键词
采样模块
分类方法
视觉
前馈神经网络
分支
注意力机制
标签
图像块
采样率
训练集
通道
线性
矩阵
参数
对象
系统为您推荐了相关专利信息
底层视觉特征
多模态
镜头
车辆行驶路径
语义特征
避让控制方法
动作识别模型
图像
实时位置
运动学特征
图像语义分割方法
图像语义分割模型
图像编码器
可见光图像
分支
巡逻机器人
计算机视觉
监控模块
导航模块
图像捕捉单元
车辆导航
车辆识别
车辆控制终端
导航系统
定位信号强度