摘要
本发明设计了一种基于深度学习的零样本图像目标检测方法,属于基于大模型的图像目标检测领域。本发明设计的视觉语言模型包含RO‑Yolo‑Backbone、HWD‑RepVL‑PAN、MCJ‑Text Contrastive Head和回归边界框目标检测模块,通过对卷积核参数共享、感受野范围的优化,增强特征提取能力,利用小波变换减少下采样纹理损失,引入多距离公式弱化类内差异和增强类间差异,旨在有效提升大数据时代下的零样本图像目标检测能力。
技术关键词
图像编码
文本编码器
样本
采样模块
马尔可夫模型
特征提取能力
图像嵌入
注意力
视觉
大数据
参数
对象
分辨率
网络
度量
纹理
系统为您推荐了相关专利信息
神经网络模型
异常数据检测
检测数据输入
数据检测方法
图谱
视频生成模型
视频生成方法
样本
光流模型
视频生成装置
密封性能检测方法
反应釜
孤立森林算法
特征值
密封性能检测系统