基于空间预测型VLPM的跨模态图文检索方法及存储介质

AITNT
正文
推荐专利
基于空间预测型VLPM的跨模态图文检索方法及存储介质
申请号:CN202410742517
申请日期:2024-06-11
公开号:CN118708675B
公开日期:2026-01-02
类型:发明专利
摘要
本发明公开了一种基于空间预测型视觉语言预训练模型的跨模态图文检索方法及存储介质,所述方法通过将局部语义预测视觉空间位置引入到视觉语言预训练模型中,使预训练模型能够学习到更有效的高级语义,有效提升下游跨模态图文检索任务的性能;利用基于空间预测型视觉语言预训练模型对下游图文检索数据进行特征提取,构建四元组损失函数并执行有监督跨模态图文检索;利用四元组构造模块挖掘与正样本具有强语义关联假负例样本,减少了假负例样本对图文检索的影响。
技术关键词
预训练模型 图文检索方法 跨模态图文检索 图像块特征 特征提取器 非暂态计算机可读存储介质 相似性度量函数 视觉 重叠面积 文本 语义 样本 模块 因子 处理器 数据
系统为您推荐了相关专利信息
1
一种基于预训练模型的冗余数据处理方法及系统
冗余数据处理方法 预训练模型 高温度 数据输入模块 数据处理系统
2
一种基于BEV感知的道路点云提取方法
点云提取方法 三维点云数据 标准化方法 道路特征 预训练模型
3
基于CVAE和GPT的日前负荷预测方法、装置
负荷预测方法 数据 发电机组 电力 发电计划优化
4
一种基于边界增强和双编码器融合的脑肿瘤MRI图像分割方法
双编码器 像素 图像分割方法 图像分割模型 亮度
5
基于SimCLR的BCG信号自监督特征提取与睡眠质量评估方法
神经网络结构 传感器设备 一维卷积神经网络 信号特征 构建分类器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号