摘要
本发明提出了一种融合卷积和稀疏视觉Transformer的高效特征学习方法与系统,涉及计算机视觉领域。本发明设计卷积与稀疏自注意力融合模块(CATB)作为神经网络CATFormer的主要构建块,在图像处理任务中根据特征图的空间位置进行均匀采样并进行交互,实现自注意机制的稀疏化,在降低自注意力的计算复杂度的同时,实现神经网络捕获图像的全局信息,并利用卷积的扩散特性,有效传递全局信息,从而实现高效的特征学习;堆叠多个CATB模块构成了神经网络CATFormer,在CATB中设置采样步长实现稀疏采样,从而提取具有全局代表性的token,所得到的神经网络模型可用于图像分类、目标检测、实例分割和语义分割等视觉任务的主干。
技术关键词
特征学习方法
特征学习系统
特征金字塔
阶段
全局信息融合
图像处理
堆叠模块
捕获特征
神经网络模型
实例分割
计算机视觉
复杂度
注意力机制
网络模块
线性
系统为您推荐了相关专利信息
存储程序代码
客户等待时间
模型更新
模块
电子设备
BIM技术
建筑物模型
交通导流技术
交通组织方法
道路桥梁工程
集合经验模态分解
农作物监管
农作物生长环境
融合特征
云监管方法
特性挖掘方法
聚类
FCM算法
轮廓系数
肘部法则
电子商务广告
CRF模型
HMM模型
电子商务平台
强化学习模型