摘要
本申请涉及计算机技术领域,公开了一种图文匹配方法、装置、设备、存储介质及计算机程序产品,该方法包括:响应于输入的查询文本,将查询文本输入预设图文匹配模型,通过预设图文匹配模型分别提取候选图像的图像特征和查询文本的文本特征,预设图文匹配模型为基于文本模内对比损失进行细粒度对齐训练获得的模型,基于文本模内对比损失的细粒度对齐训练用于增强模型对语义相似文本的区分能力,基于图像特征和文本特征确定与查询文本匹配的目标图像;由于本申请预先基于文本模内对比损失对图文匹配模型进行细粒度对齐训练,以增强模型对语义相似文本的区分能力,从而能够提升图文匹配过程中细粒度匹配的精度,进而能够提高图文匹配的准确性。
技术关键词
图文匹配方法
文本
计算机程序产品
图像
匹配设备
视觉特征
语义特征
数据
处理器
样本
特征提取模块
匹配模块
跨模态
输入模块
存储器
编码
主题
系统为您推荐了相关专利信息
图像
数据读取模块
算法模型
后处理模块
筛选算法
可见光图像
特征分析方法
多模态图像数据
深度神经网络
动态
仿真分析
数字孪生
三维模型
电厂设备
设备运行数据
问答数据生成方法
表格
大语言模型
答案
有向无环图
模型训练方法
大语言模型
图像
生成方法
噪声数据