摘要
本发明提出了一种基于特征抑制和正交约束的行人属性识别方法及系统,包括:将获取的数据集D中的任意一张图像作为主干网络ViT的输入利用多个Transformer编码层对输入的图像进行行人属性特征提取并输出特征f;再将输出特征f作为选择性特征激活方法SFAM的输入,输出特征FS;最后将输出的两个特征f和FS分别送到线性分类层中进行属性概率的预测,再将两个概率预测相加,得到最终的预测结果。本发明的方法利用ViT来捕获不同属性特定区域之间的远程上下文关系;提出的SFAM模块先计算出模型关注对每个区域的关注度,对关注度高的属性区域进行一定程度的抑制,从而使得模型可以关注更多容易忽视的属性。
技术关键词
行人属性识别方法
激活方法
输出特征
代表
行人属性识别系统
网络
算法框架
标签
特征值
处理器
线性
因子
编码
标记
模块
存储装置
图像块
可读存储介质
系统为您推荐了相关专利信息
协同注意力
融合特征
sigmoid函数
融合策略
通道
图像语义分割方法
面向无人机
编码器
融合特征
生成上下文感知