一种基于多模态模型进行搜索的方法和系统

正文

推荐专利

一种基于多模态模型进行搜索的方法和系统

申请号：CN202510422711

申请日期：2025-04-07

公开号：CN119938986B

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了一种基于多模态模型进行搜索的方法和系统。方法包括：对视频进行分割，将视频各帧中，前后连贯且相似度高于阈值的帧集合，作为一个场景单元；对场景单元进行关键帧提取；对关键帧进行图像特征和文本特征提取；将关键帧图像特征和文本向量特征进行融合，得到反映场景单元内容的多模态特征；对用户输入的自然语言查询进行语义理解，将其转换为相应的查询特征向量；将查询特征向量与数据库中的多模态特征向量进行相似性计算，根据相似度对场景单元进行排序，返回最相似的场景单元；将检索到的场景单元按照相似度排序后呈现给用户。

技术关键词

关键帧多模态场景文本特征向量模态特征图像特征向量图像特征提取视频特征向量自然语言 ResNet网络计算机程序产品字幕像素前馈神经网络特征提取单元语义可读存储介质

系统为您推荐了相关专利信息

一种用于景区设备的智能控制系统及方法

运营控制平台安全监控平台景区设备智能控制系统硬件设备

服装板片生成方法、装置、电子设备及存储介质

板片服装命令符号生成方法

一种配电网继电保护定值整定方法及装置

配电网继电保护定值整定方法分布式新能源继电保护装置定值配电网短路

开关状态目标检测方法、装置、设备、介质和产品

图像电力设备多模态特征融合开关特征卷积神经网络提取

基于倾斜摄影的实景三维模型中大规模生物集群仿真方法

实景三维模型仿真方法路径查找算法集群三维空间信息

一种基于多模态模型进行搜索的方法和系统

站点导航

APP 下载