摘要
本发明公开了一种基于二分搜索和CLIP的零样本目标检测算法,属于图像目标检测技术领域,具体包括:构建数据集训练CLIP模型,对目标图像进行预处理,设定边界搜索的初始范围,将预处理后的目标图像输入CLIP模型,使用二分搜索和paint method确定目标的初级边界框,利用CLIP模型计算目标图像与目标文本的相似度,生成目标的文本描述信息,同时结合目标在图像中的位置信息,对初级边界框进行调整优化,生成最终边界框,本发明在处理新类别目标检测、提升计算效率和减少人工标注成本方面具有显著的优势。
技术关键词
样本
图像批处理
图像编码器
文本编码器
图像嵌入
算法
尺寸
数据
颜色
黑色
色彩
图片
像素
标记