摘要
本发明提供一种基于CLIP和图像分类的智能以图搜图方法,涉及图像处理技术领域。所述方法包括:获得待搜索图像分类的类别;获取分类概率最高的N个类别和对应的概率,并选择需要检测的类别作为以图搜图的提示词;通过CLIP模型编码,获得n维的待搜索图像特征向量和提示词特征向量;确定需要检测的类别的类别概率;确定提示词特征向量的权重;确定融合特征向量;创建图像向量仓库,并通过CLIP模型编码,获得图像向量仓库的每张图像的特征向量;确定图像向量仓库的每张图像与待搜索图像的余弦距离;确定图像向量仓库中与待搜索图像最相似的图像。根据本发明,可指定搜索图像中的特定物体图像,并同时保留部分整体图像的特征。
技术关键词
仓库
图像特征向量
特征值
图片分类模型
图像处理技术
编码
物体
系统为您推荐了相关专利信息
视频生成方法
文本段落
图片
计算机可读指令
模板
综合评估模型
关键词特征
价值综合评估
时间序列模型
文本
配送调度方法
禁忌搜索算法
调度优化模型
节点
构建无人机
足部健康
鞋码值
构建知识图谱
年龄
神经网络模型
实时图像处理
视觉
深度学习特征
机器学习模型
深度特征提取