一种基于多模态语义的图像检索方法、装置及设备

AITNT
正文
推荐专利
一种基于多模态语义的图像检索方法、装置及设备
申请号:CN202510519149
申请日期:2025-04-23
公开号:CN120407825A
公开日期:2025-08-01
类型:发明专利
摘要
本申请公开了一种应用于多模态检索技术领域的一种基于多模态语义的图像检索方法、装置及设备。在该基于多模态语义的图像检索方法中,获取包括参考图像和修改文本的检索请求。基于参考图像和修改文本,分别提取包括参考图像的视觉信息的第一全局图像特征、包括修改对象的信息的对象特征以及包括修改文本的语义信息的描述特征。如此能够提取得到较为完整的视觉信息以及语义信息。对第一全局图像特征、对象特征和描述特征进行整合,得到检索特征。最后,利用检索特征确定目标图像,生成检索结果。利用融合了视觉信息和语义信息的检索特征进行检索,能够增强跨模态信息的检索能力,提升检索得到的目标图像的准确性和有效性,满足在多模态图像检索场景下用户的检索需求。
技术关键词
文本 图像检索方法 对象 拼接模板 语义 多模态 检索图像 图像检索设备 图像检索装置 视觉 可读存储介质 终端设备 检索技术 处理器 存储器 指令 跨模态 计算机 有效性
系统为您推荐了相关专利信息
1
一种软件开发系统以及软件开发方法
软件开发方法 监督学习模型 重构 抽象语法树 软件开发系统
2
基于AI助手平台的员工信息查询方法、装置及存储介质
终端设备 语句 关键字 员工 屏幕
3
图像智能变换方法、设备和存储介质
对象 高效地对图像 双三次插值 边缘检测算法 裁剪模块
4
一种基于企事业单位信息获取关联公司的方法和相关装置
联合损失函数 多头注意力机制 动态 样本 关键词
5
一种基于知识图谱的水电科技文档查重方法及装置
文档查重方法 知识图谱数据 文本 计算机执行指令 科技
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号