摘要
本发明提出基于自适应对比学习的跨模态图文检索方法和系统,包括:在每对正样本的概率分布中引入两个边界参数,计算图像I对应T的概率,调整每对正样本的语义一致性,以及区分克隆负样本的分布特性;定义并计算每个批次样本的显著性分数,选取显著性分数最大和最小的负样本序列作为观测克隆负样本和显著负样本;根据高斯判别分析方法,预测每个批次样本的所有的潜在克隆负样本并生成锚点样本;根据锚点样本的相似度的两个边界条件,迭代更新两个边界参数。本发明针对图文数据集中容易出现的克隆负样本,利用高斯判别分析无需额外训练地预测出每个训练批次中潜在的克隆负样本。为后续进一步学习克隆负样本潜在的高维关键语义打下基础。
技术关键词
图文检索方法
样本
文本编码器
图像编码器
模态特征
判别分析方法
跨模态图文检索
锚点
代表
二分类方法
索引
参数更新模块
语义
定义
表达式
视觉
系统为您推荐了相关专利信息
语音生成模型
样本
语音特征信息
文本
语音生成方法
数据分析方法
计算机可读指令
数据分析装置
计算机设备
通知
自动识别方法
门控循环单元网络
短时傅里叶变换
噪声源识别
环境噪声控制