一种基于细粒度对齐与重排序的图文检索方法及系统

正文

推荐专利

申请号：CN202510961077

申请日期：2025-07-12

公开号：CN120950744A

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了一种基于细粒度对齐与重排序的图文检索方法及系统，包括：输入待检索的图像和文本，利用预训练模型CLIP强大的特征提取能力对输入图文分别编码；利用跨模态交互模块自适应地将文本表示对齐到相关图像区域；计算图像与文本之间的相似度得分，获得初步匹配结果；通过重排序机制对初始相似度矩阵进行反向检索；结合三种损失函数训练检索模型，并且引入单模态预训练教师模型离线提取的知识作为软标签监督信号，优化相似度学习过程；用KL散度来衡量模型输出的概率分布与教师模型提供的软标签之间的差异，提升图文之间语义对齐的能力。本发明通过联合使用三种损失模型既有效对齐图文间的语义关系，又保证了模态内部的结构清晰与一致性。

技术关键词

图文检索方法语义跨模态预训练模型特征提取能力残差模块教师注意力机制图像特征向量文本编码器矩阵图像嵌入检索系统标签视觉特征

系统为您推荐了相关专利信息

模型微调方法、装置、存储介质及电子设备

字段微调方法文本数据参数

面向公共平台用户参与多任务贝叶斯网络模型及分类方法

贝叶斯神经网络多任务分类贝叶斯网络模型平台图像分类模型

一种图像分割方法、装置、设备及存储介质

图像分割模型语义图像分割方法热力图采样模块

交易风险监控方法、装置、设备、介质和程序产品

交易风险监控方法语法结构数据依存句法分析文本

一种基于检索生成判别模型的单元测试方法

语义向量编码器模块混合特征提取单元测试方法索引

一种基于细粒度对齐与重排序的图文检索方法及系统

站点导航

APP 下载