一种基于CLIP的相似性对齐蒸馏网络的弱监督目标定位方法及系统

正文

推荐专利

申请号：CN202510701712

申请日期：2025-05-28

公开号：CN120599221A

公开日期：2025-09-05

类型：发明专利

摘要

本发明属于但不限于计算机视觉技术领域，公开了一种基于CLIP的相似性对齐蒸馏网络的弱监督目标定位方法，输入图像和文本数据至预训练的CLIP模型中进行处理；CLIP模型利用其深度学习能力从图像和文本中提取出高级视觉和语义特征，并生成自注意力图；图像特征传送到解码器中，解码器对特征进行细致的解析和微调，以更好地适应特定的定位需求；解码后的图像特征与文本特征共同用于计算相似度，生成前景预测图；类激活图和前景预测图在CGDM模块的引导下进一步优化，同时前景预测图经过EDFE模块的处理，该模块通过指数衰减技术强化前景并抑制背景，提高定位图的清晰度；之后类激活图和前景预测图二者结合，生成最终的定位图。

技术关键词

定位方法衰减技术解码器训练深度学习模型信息数据处理终端图像蒸馏文本语义特征网络注意力指数定位系统特征提取能力计算机视觉技术数据输入模块计算机设备处理器

一种基于CLIP的相似性对齐蒸馏网络的弱监督目标定位方法及系统

站点导航

APP 下载