一种基于多模态大模型的图文智能检索方法

正文

推荐专利

一种基于多模态大模型的图文智能检索方法

申请号：CN202510237728

申请日期：2025-03-03

公开号：CN120873245A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开一种基于多模态大模型的图文智能检索方法，具体包括如下步骤：使用本地图文数据对多模态大模型进行微调，提升垂直领域下图片描述能力；针对所有库图片离线生成文本描述，并通过文本向量化模型生成文本向量并存储到向量数据库中；选取语义重排序模型，对检索到的候选图像和文本进行重新排序，提升图文检索的精确度和质量；根据用户输入的查询文本或图像，通过向量数据库检索出与查询相关的多个候选图像和文本描述，并利用语义重排序模型对候选文本进行重排序，确保最相关的图像及其描述优先返回；在不同场景的测试集上评估图文检索的性能，确定最终向量数据库余弦相似度过滤阈值，确保检索性能与用户体验的平衡。

技术关键词

智能检索方法文本排序模型图文多模态语义图像图片离线场景矩阵数据批量对象实体参数

系统为您推荐了相关专利信息

同款商品匹配方法、装置、计算机设备和存储介质

商品匹配方法多模态图像处理模块文本实体

事件识别方法、装置、计算机设备及存储介质

事件识别方法训练文本数据对象聚类事件识别装置

一种基于深度学习的阀门启闭状态识别与诊断方法

阀门启闭状态分层解码器阶段序列诊断方法

知识蒸馏方法、装置、设备和介质

机器翻译模型分词知识蒸馏方法学生文本

一种网络服务代理方法、装置、设备、存储介质及产品

网络服务代理方法网络代理服务器网络传输协议虚拟网络设备网络管理信息

一种基于多模态大模型的图文智能检索方法

站点导航

APP 下载