一种基于频空特征动态校准的复杂场景下的人群计数方法

AITNT
正文
推荐专利
一种基于频空特征动态校准的复杂场景下的人群计数方法
申请号:CN202510794789
申请日期:2025-06-14
公开号:CN120635819A
公开日期:2025-09-12
类型:发明专利
摘要
本发明提出一种基于频空特征动态校准的复杂场景下的人群计数方法,采用频空特征动态校准和Transformer驱动的点查询机制,首先,对训练集图像采用随机翻转、放缩及裁剪的数据增强方法,并统一缩放至固定尺寸输入VGG‑16骨干网络进行多尺度特征提取;接着,通过WTConvFeatureFusion模块融合不同层输出的频空特征,结合动态位置编码构建特征校准机制;然后,将校准后的特征图输入Transformer编码器‑解码器架构,利用点查询生成函数在编码特征上嵌入可学习的位置锚点,通过解码器迭代优化空间分布;最后,由预测模块输出归一化坐标点集,采用匈牙利匹配算法计算分类‑回归组合损失,反向优化模型参数,实现端到端的人群数量统计与位置定位;本发明能够准确有效地在复杂场景下进行人群计数。
技术关键词
计数方法 查询特征 匈牙利匹配算法 动态位置编码 多尺度特征提取 坐标 场景 解码器架构 编码特征 匈牙利算法 校准机制 查询机制 图像 编码器 交叉注意力机制 更新网络参数
系统为您推荐了相关专利信息
1
一种钢化玻璃碎片图像分割与碎片计数方法
钢化玻璃 计数方法 模板边框 特征提取网络 图像分割模型
2
一种用于情绪识别的边云协同系统及其方法
情绪特征 情绪识别模型 轻量化模组 云端服务器 数据传输模块
3
一种用于污水处理厂巡检的增强现实方法及系统
双向特征金字塔 数字孪生模型 标志物 现实方法 设备特征信息
4
结合多尺度文本语义的用户与数据产品匹配性判别方法、系统、设备及介质
文本 判别方法 多尺度特征提取 语义特征 模板
5
一种单图像反射去除方法和装置
交互特征 反射特征 融合特征 注意力 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号