摘要
本发明公开了一种基于组间特征图计算的轻量级食品图像识别方法,属于计算机视觉技术领域。该方法通过IRB模块实现局部特征提取,结合LIT模块中FGT模块的分组变压器结构完成全局特征提取。其中FGT模块采用Unfold线性变换将特征图转换为Patch序列,通过空间自注意力机制与前馈网络实现全局关系捕捉,并利用Fold操作重建特征维度,降低计算复杂度。创新性地引入通道混洗、组间混洗及不规则分组策略,配合高效通道注意力机制(ECA)对拼接特征进行通道重校准,有效提升多尺度特征融合能力。该方法解决了传统食品图像识别模型参数量大、计算复杂度过高且无法平衡精度与速度的难题,特别适用于资源受限的移动设备食品识别场景。
技术关键词
食品图像识别方法
图像识别模型
代表
变压器模块
通道注意力机制
全局特征提取
局部特征提取
全局平均池化
输出特征
多尺度特征融合
卷积模块
计算机视觉技术
食品识别
前馈神经网络
变压器结构
残差结构
特征值
系统为您推荐了相关专利信息
瓦斯涌出量
量子粒子群算法
优化预测模型
重构
模型超参数
频段
特征选择
独立成分分析
通道
脑电信号特征提取
粒子
场景搜索方法
自动驾驶系统
动态跟踪车辆
高风险
锂电池健康状态
运动扫描装置
图像识别装置
数据采集装置
建立磁场