一种增强细粒度对象检索性能的图像检索方法、系统、设备及介质

正文

推荐专利

申请号：CN202511040453

申请日期：2025-07-28

公开号：CN120910296A

公开日期：2025-11-07

类型：发明专利

摘要

本公开涉及图像检索技术领域，提供了一种增强细粒度对象检索性能的图像检索方法、系统、设备及介质，所述方法通过多尺度图像截取技术处理原始图像，生成目标图像和切片集合，这些图像被输入编码器，构建图像向量库，同时，多模态大模型对图像和切片进行语义分析，生成文本描述并构建文本向量库，在检索阶段，基于图像向量进行视觉相似度匹配，并基于文本向量库进行文本相似度匹配，整合结果得到候选集合，最后，通过加权融合和排序，得到最终检索结果。本公开显著提升了细粒度对象检索的准确性，通过结合视觉和文本信息，不仅增强了检索的全面性，还提高了结果的相关性，使得用户能够更快速、更精确地找到所需信息。

技术关键词

图像检索方法图像截取技术语义文本图像编码器切片多尺度计算机程序产品对象图像检索系统视觉特征图像检索技术多模态图像分割模型处理器图像特征提取计算机存储介质电子设备

系统为您推荐了相关专利信息

5G新通话下的多媒体内容智能生成方法、设备及存储介质

智能生成方法关键词多媒体记忆粒子

基于大模型的企业品牌声誉监测方法及装置、介质、设备

时间序列分析方法文本主题指标关键词

基于知识图谱与动态剪枝优化的大语言模型数理推断方法

知识点动态剪枝推断方法数学节点

基于高斯溅射的三维重建与语义地图生成方法及系统

语义地图彩色图像语义标签特征点云场景

一种基于神经符号融合算法的数值推理问题弱监督求解方法及存储介质

数值记忆收集训练数据训练神经网络融合算法

一种增强细粒度对象检索性能的图像检索方法、系统、设备及介质

站点导航

APP 下载