一种训练组合图像检索模型的方法、组合图像检索方法及装置

AITNT
正文
推荐专利
一种训练组合图像检索模型的方法、组合图像检索方法及装置
申请号:CN202510300773
申请日期:2025-03-14
公开号:CN119829789A
公开日期:2025-04-15
类型:发明专利
摘要
本发明提供了一种训练组合图像检索模型的方法、组合图像检索方法及装置,包含训练阶段和检索阶段。通过构建<参考图像,修改文本,目标图像>三元组数据集,利用图像差异描述模型扩增样本数据集,相较于人工标注,降低了标注成本,提高了效率;通过解耦和融合参考图像与修改文本特征得到图文组合特征,并通过与目标图像特征计算相似度来更新参数,从而在更细的粒度上实现图文组合,获得更加准确的图文组合特征,更好地反映出理想目标图像的特征。与现有方法相比,本发明提升了组合图像检索的召回率,降低了数据标注成本,能更好地满足交互式场景下的图像检索需求,优化用户体验。
技术关键词
图像检索模型 图像检索方法 图文 计算机可执行指令 三元组 图像检索装置 交互式场景 交叉注意力机制 优化用户体验 数据 样本 文本编码器 图像编码器 可读存储介质 特征提取模块 查询特征
系统为您推荐了相关专利信息
1
一种知识图谱构建方法、装置、电子设备以及存储介质
知识图谱构建方法 神经网络结构 文本特征向量 注意力机制 图像块
2
用于无人驾驶车辆的装载路径规划方法、装置及存储介质
无人驾驶车辆 路径规划方法 计算机可执行指令 路径规划单元 地图单元
3
一种基于大数据的医疗数据处理方法、系统、设备及介质
医疗数据处理方法 医疗影像数据 医疗文本数据 融合特征 大数据
4
一种基于深度学习的音频哈希生成方法
主成分分析降维 生成方法 短时傅里叶变换 注意力机制 音频特征
5
单项目芯片文件管理方法、电子设备和介质
文件管理信息 文件管理方法 项目 待测芯片 计算机可执行指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号