摘要
本发明提供了一种训练组合图像检索模型的方法、组合图像检索方法及装置,包含训练阶段和检索阶段。通过构建<参考图像,修改文本,目标图像>三元组数据集,利用图像差异描述模型扩增样本数据集,相较于人工标注,降低了标注成本,提高了效率;通过解耦和融合参考图像与修改文本特征得到图文组合特征,并通过与目标图像特征计算相似度来更新参数,从而在更细的粒度上实现图文组合,获得更加准确的图文组合特征,更好地反映出理想目标图像的特征。与现有方法相比,本发明提升了组合图像检索的召回率,降低了数据标注成本,能更好地满足交互式场景下的图像检索需求,优化用户体验。
技术关键词
图像检索模型
图像检索方法
图文
计算机可执行指令
三元组
图像检索装置
交互式场景
交叉注意力机制
优化用户体验
数据
样本
文本编码器
图像编码器
可读存储介质
特征提取模块
查询特征
系统为您推荐了相关专利信息
知识图谱构建方法
神经网络结构
文本特征向量
注意力机制
图像块
无人驾驶车辆
路径规划方法
计算机可执行指令
路径规划单元
地图单元
医疗数据处理方法
医疗影像数据
医疗文本数据
融合特征
大数据
主成分分析降维
生成方法
短时傅里叶变换
注意力机制
音频特征
文件管理信息
文件管理方法
项目
待测芯片
计算机可执行指令