摘要
本发明涉及一种按照图片风格进行搜索的方法,包括以下步骤:S1:获取用户上传的图片;S2:使用多模态编码模型的图像编码模型对上传的图片进行推理,得到混合的嵌入向量:S3:使用提示词反推模型对上传的图片进行推理,得到描述该图片内容的文本;S4:将所述文本输入给多模态编码模型的文本编码模型进行推理,得到物体的嵌入向量;S5:采用混合的嵌入向量减去物体的嵌入向量,得到风格的嵌入向量。本发明可以从用户上传的图片中解耦出物体信息和风格信息,以实现按需搜索。
技术关键词
图片
图像编码
风格
多模态
文本
物体