一种基于多模态模型的媒资库图片检索方法

正文

推荐专利

一种基于多模态模型的媒资库图片检索方法

申请号：CN202411463712

申请日期：2024-10-21

公开号：CN118964663B

公开日期：2025-02-14

类型：发明专利

摘要

一种基于多模态模型的媒资库图片检索方法，包括以下步骤：S1、采集图片和与其相对应的文本数据，并对图片进行预处理；S2、对图片和相对应的文本数据统一进行编码，生成图片整体场景描述和图片多标签描述；S3、通过多模态嵌入融合网络将图片整体场景描述和图片多标签描述转换为高维嵌入向量，并进行融合；S4、将用户的搜索文本转化为向量，并与融合后的图片向量采用相似度计算方法，来确定对应的图片。本发明提供的基于多模态模型的媒资库图片检索方法，能够通过将图像和文字信息相结合，更加准确地描述图像内容，从而实现更高效的图片搜索。

技术关键词

图片检索方法图片多标签多模态文本度计算方法数据场景序列编码样本色彩训练集矩阵网络图像线性定义参数

系统为您推荐了相关专利信息

一种注意力检测方法、装置及设备

时间序列特征多模态特征眼部关键点学生注意力检测方法

基于多源遥感的高寒湿地动态监测与健康评价方法及系统

健康评价方法时空卷积神经网络支持向量机分类算法时间序列数据分析多模态数据融合

一种行政处罚涉案金额提取方法及系统

文本分类模型规则算法有效性关键字关键词

一种多模态智能数字人的人机交互方法和系统

人机交互方法监测数据处理情感倾向识别语音声学特征性能监测数据

物联网设备数据的云端存储方法和系统

神经网络模型云端存储方法轻量级加密算法物联网设备数据间隔特征

一种基于多模态模型的媒资库图片检索方法

站点导航

APP 下载