基于生成式模型的文本信息引导的自进化目标检索方法

正文

推荐专利

申请号：CN202510767139

申请日期：2025-06-10

公开号：CN120316300B

公开日期：2025-10-03

类型：发明专利

摘要

本发明提供了一种基于生成式模型的文本信息引导的自进化目标检索方法，对输入图片和文本进行细粒度信息提取过程，采用跨模态生成式模型，进行文本信息的模态转化，生成原始文本与每一个短语相应的图像信息，将生成图像与输入图像进行多粒度特征动态匹配与对齐，根据匹配结果排序，达到目标检索的目的。本发明将跨模态的目标检索任务转化为了同模态的检索匹配任务，利用生成式模型将输入文本信息转化为视觉图像，显著拉近了双方的语义距离，提高了模型的检索能力，生成式模型可以采用任何种类的生成式模型，实现了即插即用，可以随着生成式模型和图像编码器的不断迭代实现效果的提升，拥有自进化的特性。

技术关键词

生成图像特征检索方法生成图像集合图像块特征文本生成图像视觉图像信息图像编码器图像分割方式跨模态多粒度特征图像特征向量图像分割方法支持自定义可读存储介质图片对齐方法图像匹配

基于生成式模型的文本信息引导的自进化目标检索方法

站点导航

APP 下载