摘要
本申请提供了一种跨模态特征提取模型训练方法、检索方法、系统及产品,该方法包括:采集训练数据,训练数据包括多张图像和其对应的描述文本组;获取掩码图像以及掩码文本,基于特征提取模型得到训练图像特征、训练文本特征、掩码图像特征和掩码文本特征;基于掩码图像特征以及第一语言和第二语言的训练文本特征进行建模,构建跨语言蒸馏掩码图像模型的第一损失函数;基于训练图像特征以及第一语言和第二语言的掩码文本特征进行建模,构建跨语言掩码语言模型的第二损失函数;基于第一损失函数和第二损失函数进行优化训练,以得到优化的特征提取模型。本申请有利于提高跨模态跨语言特征提取的准确性。
技术关键词
融合特征
文本
特征提取模型
图像
图文检索方法
跨模态
蒸馏
特征提取模块
检索系统
计算机程序产品
数据
匹配模块
标签
信号
处理器