摘要
本申请公开了一种应用于多模态检索技术领域的一种基于多模态语义的图像检索方法、装置及设备。在该基于多模态语义的图像检索方法中,获取包括参考图像和修改文本的检索请求。基于参考图像和修改文本,分别提取包括参考图像的视觉信息的第一全局图像特征、包括修改对象的信息的对象特征以及包括修改文本的语义信息的描述特征。如此能够提取得到较为完整的视觉信息以及语义信息。对第一全局图像特征、对象特征和描述特征进行整合,得到检索特征。最后,利用检索特征确定目标图像,生成检索结果。利用融合了视觉信息和语义信息的检索特征进行检索,能够增强跨模态信息的检索能力,提升检索得到的目标图像的准确性和有效性,满足在多模态图像检索场景下用户的检索需求。
技术关键词
文本
图像检索方法
对象
拼接模板
语义
多模态
检索图像
图像检索设备
图像检索装置
视觉
可读存储介质
终端设备
检索技术
处理器
存储器
指令
跨模态
计算机
有效性
系统为您推荐了相关专利信息
软件开发方法
监督学习模型
重构
抽象语法树
软件开发系统
对象
高效地对图像
双三次插值
边缘检测算法
裁剪模块
文档查重方法
知识图谱数据
文本
计算机执行指令
科技