摘要
本申请提出了一种用于人群计数的多维动态感知和渐进式聚焦网络模型,涉及计算机视觉技术领域,包括:前端子网络,用于对预处理后的输入图像进行浅层图像特征提取,获得图像浅层特征;主体子网络,用于基于图像浅层特征实现多分支特征交互,生成深层特征和跨层特征,对深层特征和跨层特征进行交叉注意力处理和多尺度特征融合,对融合后的特征进行跨维度的注意力建模,并经层归一化输出深度特征;后端子网络,用于对深度特征进行高维特征构建与空间分辨率调整获得中间特征,对中间特征进行特征优化,并进行注意力融合与密度解码,输出密度图和目标注意力图。通过上述网络模型可以实现广域场景的人群计数。
技术关键词
注意力
网络模型训练方法
融合特征
子模块
结构组
动态
跨层特征
多分支
特征提取模块
通道
输出特征
密度
图像特征提取
解码模块
压缩特征
Sigmoid函数
空间权重矩阵
系统为您推荐了相关专利信息
剩余油饱和度
饱和度场
输出特征
三维卷积神经网络
序列特征
深度强化学习算法
Rician信道
功率控制方法
令牌
历史交互信息