摘要
本发明的一种基于门控自适应图文特征融合的换装行人重识别算法,通过结合图像和文本描述信息,克服传统行人重识别方法在面对目标人物更换服装、背景变化等复杂场景时的局限性,通过引入来自文本描述的衣物变化信息,以及图像特征的模态融合,实现了在不同服装条件下的准确行人识别。该算法通过大模型提取特征,并结合图像特征注意力模块att_I、文本特征注意力模块att_T,权重计算dynamic_scalar模块以及门控自适应特征融合模块,对两种模态的特征进行自适应融合。同时,通过引入对比学习计算损失函数,有效提升了算法的性能。
技术关键词
行人重识别算法
Sigmoid函数
注意力
图像特征向量
图像编码器
融合特征
文本特征向量
模块
非线性
批量
文本编码器
图文
正则化技术
重识别方法
行人识别
网络
系统为您推荐了相关专利信息
多模态数据融合
联邦学习系统
中心服务器
融合策略
注意力机制
决策系统
运动控制模型
多模态
运动控制命令
模块