基于开放词汇自适应定位的行人属性识别方法

正文

推荐专利

申请号：CN202510684296

申请日期：2025-05-26

公开号：CN120599657A

公开日期：2025-09-05

类型：发明专利

摘要

本发明提出了一种基于开放词汇自适应定位的行人属性识别方法，步骤为：对图像数据集中的图像进行预处理得到预处理图像，提取输入的提示语文本的文本特征；利用关键点提取技术提取所有行人的骨骼关键点，得到预测热图，确定关键点信息集合，选择最接近图像中心的目标行人；进行关键点筛选，得到提示点，生成最终的关键点集合；对行人进行目标检测得到提示框，将最终的关键点集合转化为提示向量，利用SAM算法分割得到分割掩码图；生成姿态区域定位图；将姿态区域定位图和描述行人的文本输入到跨模态的开放词汇行人属性识别模块中，得到行人的具体属性。本发明解决了传统方法无法应对新属性和复杂场景的问题，提升了行人属性识别系统的鲁棒性和适应性。

技术关键词

行人属性识别方法图像编码器文本编码器多级卷积神经网络视觉特征卷积神经网络提取特征行人属性识别系统骨骼关键点人体关键点多层注意力机制语义向量损失函数优化模块跨模态

系统为您推荐了相关专利信息

一种基于3D视觉的物体定位及姿态识别方法

姿态识别方法图像 3D点云数据物体双流神经网络

家用电器的维修指导方法和装置

大语言模型维修指导方法文本家用电器故障音频匹配

基于场景图谱匹配的智能体导航效果增强方法、设备及介质

图谱节点场景规划匈牙利算法

知识图谱构建模型的训练和知识图谱构建方法、装置及设备

多模态样本图文关系知识图谱构建方法

模型训练方法、电子设备及计算机可读存储介质

多模态模型训练方法文本编码器图像编码器数据处理方法

基于开放词汇自适应定位的行人属性识别方法

站点导航

APP 下载