摘要
本发明涉及行人重识别技术领域,尤其是提供了一种基于多域特征对齐的端到端跨模态行人重识别方法。该方法包括通过文本描述分离模块,将原始文本描述拆分为身份描述与服装描述两个子描述,为跨模态特征对齐提供结构化语义输入;根据身份与服装两个子描述,身份‑服装双向解耦对齐模块利用注意力机制和门控加权策略,以实现跨模态特征对齐;基于跨模态特征对齐,将Mamba状态空间模型SSM引入跨模态行人重识别ReID任务中,融合图像与文本特征;根据融合图像与文本的特征,设计多目标鲁棒优化模块进行优化,输出最终检索结果,该方法提升了细粒度语义对齐的精度,实现了有效的上下文协同,达到了判别性与鲁棒性之间的平衡。
技术关键词
服装
文本
身份
图像嵌入
跨模态
状态空间模型
重识别方法
多任务损失函数
多域特征
表达式
语义
行人重识别技术
鲁棒性
对齐模块
模态特征
交叉注意力机制
双分支结构
系统为您推荐了相关专利信息
字幕
翻译模型
可读存储介质
计算机程序产品
重构
身份认证系统
指纹技术
生物识别
三维点云数据
二维图像数据
运输机器人
放料平台
放料装置
安全控制装置
自动导引车