摘要
本申请公开了一种多模态检索模型的训练方法、多模态检索方法及装置,涉及多模态检索技术领域,包括构建向量数据库;基于向量数据库,构建难负样本训练集;难负样本训练集包括:多个查询文本和多个查询文本对应的难负样本文档图片;将难负样本训练集输入初始多模态检索模型进行训练,获取目标多模态检索模型。由于向量数据库存储多篇文档的多向量表示,通过向量数据库可以找到与查询向量相似但不相关的负样本(即难负样本),通过向量数据库挖掘这些样本,构建难负样本训练集,可以使得模型学习到更加细微的区分特征,从而提高模型区分正负样本的能力,在检索过程中,提升检索的精确度。
技术关键词
文本
多模态检索方法
训练集
图片
训练样本集
多模态检索技术
视觉特征编码
数据
语义特征
可读存储介质
存储计算机程序
分词
检索装置
计算机程序产品
训练装置
系统为您推荐了相关专利信息
水库调度方法
GRU模型
支持向量回归模型
序列
参数
需求预测模型
页面测试方法
页面测试装置
训练样本集
进程