图文匹配方法、装置、设备、存储介质及计算机程序产品

AITNT
正文
推荐专利
图文匹配方法、装置、设备、存储介质及计算机程序产品
申请号:CN202511509696
申请日期:2025-10-22
公开号:CN120997624A
公开日期:2025-11-21
类型:发明专利
摘要
本申请涉及计算机技术领域,公开了一种图文匹配方法、装置、设备、存储介质及计算机程序产品,该方法包括:响应于输入的查询文本,将查询文本输入预设图文匹配模型,通过预设图文匹配模型分别提取候选图像的图像特征和查询文本的文本特征,预设图文匹配模型为基于文本模内对比损失进行细粒度对齐训练获得的模型,基于文本模内对比损失的细粒度对齐训练用于增强模型对语义相似文本的区分能力,基于图像特征和文本特征确定与查询文本匹配的目标图像;由于本申请预先基于文本模内对比损失对图文匹配模型进行细粒度对齐训练,以增强模型对语义相似文本的区分能力,从而能够提升图文匹配过程中细粒度匹配的精度,进而能够提高图文匹配的准确性。
技术关键词
图文匹配方法 文本 计算机程序产品 图像 匹配设备 视觉特征 语义特征 数据 处理器 样本 特征提取模块 匹配模块 跨模态 输入模块 存储器 编码 主题
系统为您推荐了相关专利信息
1
一种单视复数SAR图像目标检测方法及系统
图像 数据读取模块 算法模型 后处理模块 筛选算法
2
一种舌像特征分析方法及系统
可见光图像 特征分析方法 多模态图像数据 深度神经网络 动态
3
智慧电厂运行调整方法、装置、设备及存储介质
仿真分析 数字孪生 三维模型 电厂设备 设备运行数据
4
基于大语言模型的表格问答数据生成方法、设备、介质
问答数据生成方法 表格 大语言模型 答案 有向无环图
5
短文本生成图像模型训练方法、系统、短文本到图像的生成方法、电子设备及存储介质
模型训练方法 大语言模型 图像 生成方法 噪声数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号