摘要
本发明提出了一种基于无窗口高斯视觉Transformer的高效特征学习方法与系统,涉及计算机视觉领域。本发明设计无窗口高斯自注意力模块(WGSAB)作为神经网络WGViT的主要构建块,在图像处理任务中通过二维高斯分布采样token并进行交互,使得特征表达不受窗口的限制,实现神经网络捕获图像的长短距依赖,降低自注意力的计算复杂度,进行高效特征学习;堆叠多个WGSAB网络模块构成了神经网络WGViT,在WGSAB中高斯token采样(GTS)通过设置不同的均值、协方差和采样率来捕获不同的长短距依赖,所得到的神经网络模型可用于图像分类、目标检测、实例分割和语义分割等视觉任务的主干。
技术关键词
特征学习方法
特征学习系统
注意力
采样率
阶段
特征金字塔
网络模块
复杂度
图像处理
堆叠模块
捕获特征
神经网络模型
实例分割
计算机视觉
策略
代表
语义
系统为您推荐了相关专利信息
计划
优化卷积神经网络
医学影像数据
神经网络训练
肿瘤