摘要
本发明公开了一种基于语义和姿态信息融合的多姿态人员重识别方法,涉及计算机视觉领域。该模型主要由语义引导模块、视觉编码器、姿态引导特征聚合模块和基于姿态视图的解码器四部分组成。包括以下步骤:首先,通过语义引导模块传递原始图像输入,获得包含与人员相关的全局语义信息的特征映射,这使得模型可以提取更多的全局语义信息特征,并在不同的图像之间传递特征信息。接下来,在视觉编码器中,利用基于Transformer的图像分类模块以及相机视角信息来捕获鲁棒的全局上下文语义信息。然后,使用姿态引导特征聚合模块将姿态信息整合到全局上下文语义特征和身体部位特征中,该模块解决了不完全特征学习的问题。随后,在基于姿态视图的解码器中,使用一组可学习的姿态视图和姿态视图匹配模块来隐式增强难分辨的身体部位特征,该模块利用可学习的姿态视图来捕获与身体部位相关的特征,减少背景噪声,解决特征不匹配的问题。这个流程允许在特征融合的基础上获得更精细的特征,提高多姿态人员重识别的精准度和效率。
技术关键词
重识别方法
人体姿态估计方法
语义特征
解码器
上下文语义信息
身体
图像
三元组
标记标签
预训练模型
计算机视觉
编码器
背景噪声
匹配模块
阶段
数据
度量
系统为您推荐了相关专利信息
激光测风雷达
风速
谱峰位置
构建卷积神经网络
噪声功率
访问特征
时序特征
长短期记忆网络
淘汰方法
语义特征
仿真环境
待测车辆
驾驶仿真方法
模型训练方法
车辆行驶轨迹
医学图像分割方法
医学图像分割系统
图像分割模型
记忆
ResNet网络