一种大模型增强的跨模态检索方法、系统及相关设备

正文

推荐专利

申请号：CN202510220410

申请日期：2025-02-27

公开号：CN119719451B

公开日期：2025-05-27

类型：发明专利

摘要

本发明公开了一种大模型增强的跨模态检索方法、系统及相关设备，所述跨模态检索方法包括：获取图像‑文本对；基于所述图像‑文本对，获取图像‑文本对的大模型增强信息，结合原始图像、文本和增强信息，采用预训练CLIP模型的多分支编码器以得到多个特征向量，构建多级协同对齐损失函数，在公共语义空间对图像模态和文本模态进行协同对齐；通过所述多级协同对齐损失函数以及预构建的训练数据库对模型进行训练，通过训练后的模型进行检索。本发明通过对编码器得到的图文特征进行协同学习，通过加入辅助的语义增强信息，在公共语义空间对图像模态和文本模态进行协同对齐，以训练出更好的检索网络从而提升图像‑文本检索的准确性。

技术关键词

文本编码器图像编码器跨模态检索方法语义实体大语言模型样本非暂态计算机可读存储介质生成文本摘要损失函数设计分支梯度下降算法特征提取模块检索系统

系统为您推荐了相关专利信息

多模态小样本数据驱动的异常检测方法、系统和存储介质

异常检测系统样本异常检测方法图像编码器多模态

一种基于跨空间调节的文本驱动的风格迁移方法

风格迁移方法文本编码器代表深度卷积神经网络图像编码器

储能系统的故障诊断方法、装置、存储介质以及程序产品

故障诊断信息实体三元组储能系统图谱

一种构网型储能系统的调度系统和方法

储能单元储能系统样本功率强化学习算法

一种基于句法相似的自适应上下文学习方法

学习方法编辑距离算法语句表达式句法依存关系

一种大模型增强的跨模态检索方法、系统及相关设备

站点导航

APP 下载