摘要
本发明公开了一种基于CNN‑Transformer分阶段融合的图像分类方法及其系统,具体包括:输入图像经预处理后输入轻量化CNN骨干网络,提取浅层、中层及深层局部特征;在中层特征图上划分非重叠像块并嵌入可学习位置编码,通过线性注意力Transformer生成全局语义特征;设计动态门控融合模块,联合通道注意力与空间注意力分支生成自适应权重,加权融合局部与全局特征;通过跨层级跳跃连接将CNN浅层细节特征与Transformer深层语义特征融合,提升分类鲁棒性。系统支持模型量化、算子融合及边缘设备部署,在降低计算复杂度的同时,显著提升分类精度。
技术关键词
图像分类方法
分阶段
动态门控
语义特征
模块
网络
图像分类系统
注意力机制
矩阵
全局平均池化
层级
通道
编码
生成向量
分支
多层感知机
双线性
上采样