摘要
本发明公开了一种基于一对多匹配策略的视频行人流量估计方法,属于人流量检测技术领域。该方法包括:对所采集的视频进行等间隔采样得到视频帧,并对连续两帧图像中的行人进行目标检测与定位,生成行人头部目标点并裁剪出图像中的各个行人;在定位结果的基础上,利用卷积神经网络提取各行人的外观特征,并进行位置编码,将外观特征与位置特征进行拼接得到行人特征;通过多头解耦的自注意力机制对行人特征进行隐式匹配,得到匹配语义增强的行人特征;对两帧的行人特征之间两两计算哈达玛乘积,并输入判别器预测相识概率,最终实现一对多的行人特征匹配。本发明能够实时地对行人流量进行持续监测,流量计数结果准确率高,模型泛化能力强。
技术关键词
行人特征
流量估计方法
视频行人
多层感知机
卷积神经网络提取
行人头部
注意力机制
策略
图像
Softmax函数
矩阵
视频帧
语义
双线性插值
坐标
行人数量
编码
行人检测