摘要
本发明涉及一种基于频域感知和时空聚合的视频跨模态行人重识别方法,包括:1)构建由成对的可见光视频序列和红外视频序列组成的跨模态视频序列训练数据集;2)构建视频跨模态行人重识别网络模型,该模型包括骨干网络、频域感知的全局信息增强模块、注意力引导的时空特征聚合模块和序列级特征聚合器;骨干网络从视频序列中提取帧级特征,全局信息增强模块补充强化全局上下文信息;时空特征聚合模块捕捉关键时空依赖关系,序列级特征聚合器生成最终的行人特征表示;利用训练数据集对模型进行训练;3)利用训练好的视频跨模态行人重识别网络模型进行视频跨模态行人重识别。该方法有利于获得更加稳定、鲁棒、准确的视频跨模态行人重识别结果。
技术关键词
行人重识别网络
特征提取模块
跨模态
重识别方法
可见光视频
频域特征
序列
行人特征
前馈神经网络
注意力机制
计算机程序指令
分数阶傅里叶变换
行人重识别系统
阶段