一种基于属性学习和特征筛选的多粒度文本行人搜索方法

正文

推荐专利

申请号：CN202510962877

申请日期：2025-07-14

公开号：CN120853185A

公开日期：2025-10-28

类型：发明专利

摘要

本发明提供一种基于属性学习和特征筛选的多粒度文本行人搜索方法，对图像‑文本对进行粗粒度特征学习，利用概率模型过滤噪声数据，并通过自监督成本函数优化跨模态对齐以获取全局特征；基于编码器输出的自注意力权重筛选图像和文本的token，生成中粒度特征表示；对文本中符合形容词‑名词组合的行人属性词汇进行随机掩码，通过多模态交互编码器融合特征并预测被掩码词汇，实现细粒度属性对齐；组合粗粒度损失、中粒度损失和细粒度损失，迭代训练模型并根据验证准确率保存最优模型，输出行人搜索结果。

技术关键词

行人搜索方法文本多模态交互编码器噪声数据融合特征跨模态交叉注意力机制高斯混合模型搜索系统多层感知机图像分割输出模块标记序列理论

系统为您推荐了相关专利信息

一种基于特征融合的轻量化图像去模糊方法与系统

图像去模糊方法神经网络模型编码器多尺度高层次

基于小样本的社会大数据跨模态元学习早期谣言检测方法

谣言检测方法特征提取网络多模态信息跨模态图像特征信息

一种耦合潜在扩散模型和随机模型的非均质结构生成方法

结构生成方法非均质结构样本空间分布特征编码器训练

一种基于RAG技术动态提示词检索的多轮对话处理方法

多轮对话容错机制动态生成提示词大语言模型

自动驾驶紧急响应方法、系统、电子设备和存储介质

语音指令识别文本样本编码策略标签

一种基于属性学习和特征筛选的多粒度文本行人搜索方法

站点导航

APP 下载