多尺度多阶段的开放语义目标检测方法、装置及电子设备

正文

推荐专利

申请号：CN202411379603

申请日期：2024-09-30

公开号：CN119478340A

公开日期：2025-02-18

类型：发明专利

摘要

本申请涉及目标检测技术领域，特别涉及一种多尺度多阶段的开放语义目标检测方法、装置及电子设备，其中，方法包括：获取训练图像数据集；对训练图像数据集进行多尺度特征对齐得到视觉与语言的对齐结果；根据视觉与语言的对齐结果生成新类的伪标签，根据新类的伪标签和类的真实标注训练视觉与语言预训练模型，其中，视觉与语言预训练模型在训练过程中对伪标签进行多阶段的迭代优化；基于训练完成的视觉与语言预训练模型对目标图像进行开放语义目标检测。由此，解决了如何更好地实现对局部特征的理解以及提高物体检测精度的问题。

技术关键词

训练图像数据预训练模型多阶段视觉多尺度特征语义标签分类器电子设备感兴趣对齐模块计算机程序产品物体检测残差网络处理器指令可读存储介质

多尺度多阶段的开放语义目标检测方法、装置及电子设备

站点导航

APP 下载