一种基于预训练模型定位知识嵌入的零样本目标检测方法

正文

推荐专利

申请号：CN202410896916

申请日期：2024-07-05

公开号：CN118887382A

公开日期：2024-11-01

类型：发明专利

摘要

本发明公开了一种基于预训练模型定位知识嵌入的零样本目标检测方法，属于深度学习目标检测领域。本发明在COCO数据集基础上，构建一个区域图像、IoU标签的数据集(Region‑IoU)。然后使用该数据集对传统的视觉语言模型CLIP进行微调以及学习对IoU敏感的语义提示。使得的IoU‑CLIP模型具备局部目标定位的相关知识，能够预测检测框的IoU分数以及生成类无关IoU敏感的视觉特征。最后将该特征与IoU分数集成进开放词汇零样本检测框架。本发明可以有效地提升开放词汇零样本目标检测任务的性能。

技术关键词

预训练模型模型预训练图像视觉特征标签融合置信度语言编码器样本语义文本编码器置信度阈值数据超参数定义坐标阶段框架网络

系统为您推荐了相关专利信息

元宇宙用户选择性匹配时尚展秀虚拟系统及其方法

模特姿态特征时装虚拟系统著作权信息

一种全方位自动化的目标三维重建方法、系统和电子设备

三维重建方法步进电机驱动器生成三维模型旋转模块悬挂模块

位姿预测方法、设备及介质

分解算法训练样本集位置更新序列阶段

基于影像与病理的乳腺癌70基因检测风险评估方法

风险评估方法组学特征影像乳腺超声图像灰度共生矩阵

片上超构表面及其设计方法

纳米柱阵列波导波长全息图像微纳光学技术

一种基于预训练模型定位知识嵌入的零样本目标检测方法

站点导航

APP 下载