摘要
一种轻量卷积神经网络模型—MobileConv,基于Transformer编码器的结构,开发了一种轻量的综合卷积块CCA模块。以综合卷积块为核心算子,再结合反向残差块IRB,设计类似Transformer编码器的基本块模块MobileConv block。根据MobileConv block构建了可以广泛用于多种计算机视觉任务的MobileConv模型。本发明既保留了卷积神经网络的大量优点,却有着非常高的识别精度。通过在ImageNet、MS COCO、ADE20K等公开数据集的大量实验,验证了MobileConv模型的有效性。例如在ImageNet数据集上,仅使用一块或两块GPU(24G内存)训练的MobileConv‑S/XS/XXS在ImageNet上分别可以取得78.6%、75.7%和72.2%的top‑1精度;但它们的参数和模型复杂度开销仅为5.6M/1.4GFLOPs、2.3M/0.5GFLOPs和1.2M/0.3GFLOPs,大大超过了同级当前最优秀的模型,如SwiftFormer、ConvMLP、EMO、MobileViG和EfficientFormer,使其成为主流模型中的优秀选择。
技术关键词
轻量卷积神经网络
注意力
残差结构
通道
编码器
参数
计算机视觉
模块
核心
有效性
复杂度
精度
内存
符号
数据
算法
系统为您推荐了相关专利信息
钢帘线残余扭转
PID控制算法
数据采集程序
数据记录单元
处理单元
融合多模态特征
识别系统
文本
语音特征提取
情绪特征
表格特征
中文文本
事件特征
三元组
模型构建方法
视网膜图像分割方法
网络
视网膜血管图像
图像分割模型
级联
模式管理方法
需求预测模型
策略优化模型
异常信号
生成对抗网络