摘要
本发明提供了一种基于全局‑局部对比学习的跨模态检索方法,采用评分机制使一个实例对应多个正样本,将图像和文本全局特征输入变分自编码器,将生成特征加入正样本集合进行学习,从而进一步增强模型的判别能力;采用ResNet‑152网络和BERT模型分别提取图像和文本的局部特征,采用软注意力机制学习图像区域和文本单词之间的相关信息,软注意力机制通过加权计算每一个文本单词与每一块图像区域之间的相关性,故无需对文本单词和图像区域进行细粒度标注。本发明解决当前对比学习方法中正负样本选取不够灵活的问题,解决了现有方法忽略数据间细节语义信息的问题。
技术关键词
样本
文本
模态检索方法
评分机制
图像
注意力机制
语义
神经网络参数
定义
锚点
生成特征
编码器
可读存储介质
数据
梯度下降法
学习方法
因子
处理器
超参数
系统为您推荐了相关专利信息
训练深度学习模型
数据采集模块
模型训练模块
信息管理单元
权限管理模块
柔性控制方法
雷达点云数据
车辆状态分类
控制策略模型
深度强化学习模型
工艺参数优化方法
热喷涂涂层
孔隙率关系
喷涂工艺
机器学习模型