摘要
本发明提供一种基于区域感知的自适应多模态人群计数方法及系统,方法包括获取人群图像数据集并配对获得配准后的多模态图像;根据数据集中训练集的多模态图像提取不同特征层级的输出特征;将提取到的输出特征进行特征融合得到针对每个特征层级的融合图像,拼接生成最终的各模态各特征层级的最终融合图像;根据可见光图像得到各个模态的权重系数以对各个模态的源图像进行相加得到融合源图像;计算融合源图像与最终融合图像的区域感知损失和纹理损失及计数损失得到模型的总损失,根据总损失进行训练模型得到训练后的多模态人群计数模型;根据训练后的多模态人群计数模型预测人数及人群分布。本申请解决了融合模态及策略单一、融合质量不高的问题。
技术关键词
输出特征
模型压缩
计数方法
层级
注意力
融合特征
特征提取模块
网络
图像重建
特征融合方法
分支
纹理
多层感知机
通道
多模态特征融合
坐标
可见光
系统为您推荐了相关专利信息
智慧交通管理系统
可见光图像
大数据处理模块
特征提取单元
数据采集模块
车辆
空闲停车位
电子标签数据
模式识别模型
时序
多头注意力机制
联邦学习方法
节点特征
训练分类模型
服务器
协同控制方法
扩张状态观测器
废气
工况特征
复杂度