跨模态的图文检索处理方法与系统

正文

推荐专利

跨模态的图文检索处理方法与系统

申请号：CN202510460264

申请日期：2025-04-14

公开号：CN119988664A

公开日期：2025-05-13

类型：发明专利

摘要

本发明提供一种跨模态的图文检索处理方法与系统，应用于信息检索领域，其中，上述方法包括：获取用户在图文检索过程中输入的查询文本；通过文本编码器对查询文本进行编码，生成查询文本特征向量；通过跨模态图文检索模型，基于查询文本特征向量与外部知识库中存储的多模态嵌入表示进行相似度匹配，返回大于匹配阈值的多模态嵌入表示对应的相关结果，其中，多模态嵌入表示用于表示图像与文本的联合特征；在相关结果同时包括图像与文本时，将相关结果与查询文本输入至预设的多模态大模型中，进行带有文本辅助的图像问答，得到多模态大模型输出的检索结果；通过本发明能够更好地捕捉图像和文本之间的语义关联，从而提高图文检索的准确性。

技术关键词

文本特征向量图像特征向量跨模态图文检索样本三元组损失函数多模态文本编码器图像编码器注意力机制非暂态计算机可读存储介质图像块处理器训练集

系统为您推荐了相关专利信息

无人机捕获方法、装置、电子设备及存储介质

物体无人机捕获方法控制器运动状态分析非暂态计算机可读存储介质

一种基于深度学习的病情预警方法及系统

预测分类模型预警方法融合特征 SMOTE算法医疗数据分析技术

深度信念网络驱动的电能表故障预警方法及系统

预警模型故障记录数据深度信念网络电能表故障编码器

检测JAK2-V617F基因的引物探针组合、试剂盒及应用

引物探针组合核苷酸试剂盒数字PCR方法序列

电价数据解析方法及系统

数据解析方法数据输出格式字段样本计算机设备

跨模态的图文检索处理方法与系统

站点导航

APP 下载