摘要
本发明提出一种基于频空特征动态校准的复杂场景下的人群计数方法,采用频空特征动态校准和Transformer驱动的点查询机制,首先,对训练集图像采用随机翻转、放缩及裁剪的数据增强方法,并统一缩放至固定尺寸输入VGG‑16骨干网络进行多尺度特征提取;接着,通过WTConvFeatureFusion模块融合不同层输出的频空特征,结合动态位置编码构建特征校准机制;然后,将校准后的特征图输入Transformer编码器‑解码器架构,利用点查询生成函数在编码特征上嵌入可学习的位置锚点,通过解码器迭代优化空间分布;最后,由预测模块输出归一化坐标点集,采用匈牙利匹配算法计算分类‑回归组合损失,反向优化模型参数,实现端到端的人群数量统计与位置定位;本发明能够准确有效地在复杂场景下进行人群计数。
技术关键词
计数方法
查询特征
匈牙利匹配算法
动态位置编码
多尺度特征提取
坐标
场景
解码器架构
编码特征
匈牙利算法
校准机制
查询机制
图像
编码器
交叉注意力机制
更新网络参数
系统为您推荐了相关专利信息
钢化玻璃
计数方法
模板边框
特征提取网络
图像分割模型
情绪特征
情绪识别模型
轻量化模组
云端服务器
数据传输模块
双向特征金字塔
数字孪生模型
标志物
现实方法
设备特征信息