一种基于GPA_VLPD全局自适应的跨模态单阶段行人检测方法

正文

推荐专利

申请号：CN202410887980

申请日期：2024-07-03

公开号：CN118823830A

公开日期：2024-10-22

类型：发明专利

摘要

本发明提出一种基于GPA_VLPD全局自适应的跨模态单阶段行人检测方法，利用预训练好的视觉语言模型CLIP的Text Encoder将类别文本映射为文本特征；通过CLIP的Image Encoder获得伪标签；然后将训练集和文本特征输入到GPA‑VLPD特征提取模块，得到适用于检测行人的GPA‑VLPD模型；最后将训练完成的模型对图像进行推理检测；如果检测到行人，则框选并输出。

技术关键词

行人检测方法特征提取模块注意力文本特征向量阶段通道网络整体架构检测行人非暂态计算机可读存储介质语义检测头标签文件视觉训练集像素处理器图像无监督

系统为您推荐了相关专利信息

一种基于OBD数据的车辆全生命周期管理方法及系统

全生命周期管理方法管理策略数据分类模型云数据中心数据分析模型

一种基于氧化镓晶片的位错识别系统及其识别方法

氧化镓晶片管理终端频谱特征识别方法控制电子显微镜

一种基于多事件多任务的情绪状态评估方法及系统

状态评估方法神经网络模型多任务电信号融合特征

基于多源数据可解释性黑碳气溶胶浓度估算方法

浓度估算方法黑碳气溶胶机器学习模型超参数集成机器学习

一种基于热点区域联合跟踪模型的医学图像分割方法

医学图像分割方法编码器解码器热点高层语义特征特征提取模块

一种基于GPA_VLPD全局自适应的跨模态单阶段行人检测方法

站点导航

APP 下载