一种基于特征协同和自适应注意力调节的图文检索方法

正文

推荐专利

申请号：CN202510839450

申请日期：2025-06-23

公开号：CN120929661A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种基于特征协同和自适应注意力调节的图文检索方法，首先生成图像的区域特征集合和句子对应的文本特征集合，并采用全局‑局部特征协同增强模块，生成增强后的区域特征集合；然后将文本特征集合中的单词特征与增强后的区域特征集合进行交互匹配，获得每个单词关注的综合图像特征向量，再进行相似度计算，得到图像和句子之间的相似度分数；同时采用自适应跨模态注意力调节器模块更新每个单词关注的综合图像特征向量，并将基于最难负样本的三元组损失应用于目标函数的训练。本发明通过图像局部和全局特征的协同，实现对区域特征的增强，并优化图像区域和单词对的通道权重和注意力分布，进而提升图文之间的跨模态语义对齐能力。

技术关键词

图文检索方法图像特征向量注意力跨模态调节器线性变换矩阵残差网络文本三元组模块代表通道参数样本语义算法模型编码

一种基于特征协同和自适应注意力调节的图文检索方法

站点导航

APP 下载