一种大模型增强的跨模态检索方法、系统及相关设备

AITNT
正文
推荐专利
一种大模型增强的跨模态检索方法、系统及相关设备
申请号:CN202510220410
申请日期:2025-02-27
公开号:CN119719451B
公开日期:2025-05-27
类型:发明专利
摘要
本发明公开了一种大模型增强的跨模态检索方法、系统及相关设备,所述跨模态检索方法包括:获取图像‑文本对;基于所述图像‑文本对,获取图像‑文本对的大模型增强信息,结合原始图像、文本和增强信息,采用预训练CLIP模型的多分支编码器以得到多个特征向量,构建多级协同对齐损失函数,在公共语义空间对图像模态和文本模态进行协同对齐;通过所述多级协同对齐损失函数以及预构建的训练数据库对模型进行训练,通过训练后的模型进行检索。本发明通过对编码器得到的图文特征进行协同学习,通过加入辅助的语义增强信息,在公共语义空间对图像模态和文本模态进行协同对齐,以训练出更好的检索网络从而提升图像‑文本检索的准确性。
技术关键词
文本编码器 图像编码器 跨模态检索方法 语义实体 大语言模型 样本 非暂态计算机可读存储介质 生成文本摘要 损失函数设计 分支 梯度下降算法 特征提取模块 检索系统
系统为您推荐了相关专利信息
1
多模态小样本数据驱动的异常检测方法、系统和存储介质
异常检测系统 样本 异常检测方法 图像编码器 多模态
2
一种基于跨空间调节的文本驱动的风格迁移方法
风格迁移方法 文本编码器 代表 深度卷积神经网络 图像编码器
3
储能系统的故障诊断方法、装置、存储介质以及程序产品
故障诊断信息 实体 三元组 储能系统 图谱
4
一种构网型储能系统的调度系统和方法
储能单元 储能系统 样本 功率 强化学习算法
5
一种基于句法相似的自适应上下文学习方法
学习方法 编辑距离算法 语句 表达式 句法依存关系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号