摘要
本发明公开了一种基于人体语义感知和恢复的遮挡行人检索方法,属于计算机视觉技术领域。本发明引入了多分支增强策略,该策略采用并行的数据增强方式,涵盖基准增强、放大增强、缩小增强和覆盖增强等方法,从而极大丰富了遮挡场景下的训练样本,模型能够更好地适应不同类型的遮挡情况,提高了在复杂遮挡环境中的鲁棒性和识别能力;本发明利用Transformer的信息提取能力,确保模型能够感知缺失和遮挡的区域;本发明利用提出的人体语义感知方法定位缺失的语义部分,然后利用训练集中相似正样本对应区域的语义信息来补全缺失的部分,人体语义恢复能力在训练阶段得以学习,使得模型在测试阶段能够直接预测缺失区域,而无需依赖任何额外的辅助数据。
技术关键词
行人检索方法
语义特征
语义标签
图像
人体
身体
多分支
重构
基准
计算机视觉技术
样本
全局平均池化
遮挡场景
特征提取器
策略
数据
三元组
鲁棒性
网络
系统为您推荐了相关专利信息
核磁共振成像数据
模型构建方法
药效
特征工程方法
核磁共振成像技术
图像分类系统
分类子模型
融合特征
视野功能
视盘