一种基于多模态语义的图像检索方法、装置及设备

正文

推荐专利

申请号：CN202510519149

申请日期：2025-04-23

公开号：CN120407825A

公开日期：2025-08-01

类型：发明专利

摘要

本申请公开了一种应用于多模态检索技术领域的一种基于多模态语义的图像检索方法、装置及设备。在该基于多模态语义的图像检索方法中，获取包括参考图像和修改文本的检索请求。基于参考图像和修改文本，分别提取包括参考图像的视觉信息的第一全局图像特征、包括修改对象的信息的对象特征以及包括修改文本的语义信息的描述特征。如此能够提取得到较为完整的视觉信息以及语义信息。对第一全局图像特征、对象特征和描述特征进行整合，得到检索特征。最后，利用检索特征确定目标图像，生成检索结果。利用融合了视觉信息和语义信息的检索特征进行检索，能够增强跨模态信息的检索能力，提升检索得到的目标图像的准确性和有效性，满足在多模态图像检索场景下用户的检索需求。

技术关键词

文本图像检索方法对象拼接模板语义多模态检索图像图像检索设备图像检索装置视觉可读存储介质终端设备检索技术处理器存储器指令跨模态计算机有效性

系统为您推荐了相关专利信息

一种软件开发系统以及软件开发方法

软件开发方法监督学习模型重构抽象语法树软件开发系统

基于AI助手平台的员工信息查询方法、装置及存储介质

终端设备语句关键字员工屏幕

图像智能变换方法、设备和存储介质

对象高效地对图像双三次插值边缘检测算法裁剪模块

一种基于企事业单位信息获取关联公司的方法和相关装置

联合损失函数多头注意力机制动态样本关键词

一种基于知识图谱的水电科技文档查重方法及装置

文档查重方法知识图谱数据文本计算机执行指令科技

一种基于多模态语义的图像检索方法、装置及设备

站点导航

APP 下载