一种基于属性学习和特征筛选的多粒度文本行人搜索方法

AITNT
正文
推荐专利
一种基于属性学习和特征筛选的多粒度文本行人搜索方法
申请号:CN202510962877
申请日期:2025-07-14
公开号:CN120853185A
公开日期:2025-10-28
类型:发明专利
摘要
本发明提供一种基于属性学习和特征筛选的多粒度文本行人搜索方法,对图像‑文本对进行粗粒度特征学习,利用概率模型过滤噪声数据,并通过自监督成本函数优化跨模态对齐以获取全局特征;基于编码器输出的自注意力权重筛选图像和文本的token,生成中粒度特征表示;对文本中符合形容词‑名词组合的行人属性词汇进行随机掩码,通过多模态交互编码器融合特征并预测被掩码词汇,实现细粒度属性对齐;组合粗粒度损失、中粒度损失和细粒度损失,迭代训练模型并根据验证准确率保存最优模型,输出行人搜索结果。
技术关键词
行人搜索方法 文本 多模态交互 编码器 噪声数据 融合特征 跨模态 交叉注意力机制 高斯混合模型 搜索系统 多层感知机 图像分割 输出模块 标记 序列 理论
系统为您推荐了相关专利信息
1
一种基于特征融合的轻量化图像去模糊方法与系统
图像去模糊方法 神经网络模型 编码器 多尺度 高层次
2
基于小样本的社会大数据跨模态元学习早期谣言检测方法
谣言检测方法 特征提取网络 多模态信息 跨模态 图像特征信息
3
一种耦合潜在扩散模型和随机模型的非均质结构生成方法
结构生成方法 非均质结构 样本 空间分布特征 编码器训练
4
一种基于RAG技术动态提示词检索的多轮对话处理方法
多轮对话 容错机制 动态 生成提示词 大语言模型
5
自动驾驶紧急响应方法、系统、电子设备和存储介质
语音指令识别 文本 样本 编码 策略标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号