摘要
一种基于Swin Transformer的牛脸识别方法,获取牛脸图像,并进行标注;构建识别模型,包括图像分块模块、骨干网络、双层路由注意力模块、卷积增强合并模块和分类头;骨干网络基于Swin Transformer结构构建,分为四个级联阶段,每个阶段由Patch合并模块与多个Swin Transformer Block组成,用于逐步提取牛脸图像中的多尺度特征信息,在骨干网络某一个或几个阶段的输入输出之间引入双层路由注意力模块,增强全局上下文建模能力和空间关系建模;并在引入双层路由注意力模块的阶段的输出引入卷积增强合并模块,将阶段的输出与相应双层路由注意力模块的输出融合作为下一阶段的输入,增强特征表示能力;骨干网络输出的特征输入分类头进行分类;训练识别模型,并利用训练完成的识别模型进行牛脸识别。
技术关键词
识别方法
模块
注意力机制
Sigmoid函数
阶段
全局平均池化
上下文特征
输出特征
网络
关系建模
多层感知机
通道
训练识别模型
空间坐标信息
融合特征
图像块特征
分块