摘要
本发明公开了一种基于Transformer编码交叉注意的雾天人群计数方法,包括获取经过预处理的图像,采用Transformer的编码器网络对预处理的图像进行特征提取,得到图像的特征Fr;将图像的特征Fr输入至局部增强模块中,更新输出局部增强特征F′r;将局部增强模块输出局部增强特征F′r组成的特征序列,并将位置令牌并入至特征序列输入至解码器模块,输出最终解码特征Wr;将解码器模块输出的最终解码特征Wr组成最终特征序列,将最终特征序列进行全局平均池化,并馈送到回归头生成预测人群计数。采用Transformer作为主干网络,更好地捕捉不同位置的人群结构依赖,使得模型在大雾场景中估计人群数量上更加准确,减少误差。
技术关键词
计数方法
交叉注意力机制
解码器
编码器
二维图像特征
输出特征
ReLU函数
全局平均池化
序列
模块
前馈神经网络
令牌
图像块
误差
数据