基于时空融合的多模态存量视频高效检索方法与装置

正文

推荐专利

申请号：CN202411684267

申请日期：2024-11-22

公开号：CN119884412A

公开日期：2025-04-25

类型：发明专利

摘要

本发明提供一种基于时空融合的多模态存量视频高效检索方法与装置，包括：计算待检索视频的帧间相似度，并基于帧间相似度删除待检索视频的冗余帧，得到目标待检索视频；基于查询文本对目标待检索视频进行筛选处理，得到多个目标待检索视频片段；对查询文本和多个目标待检索视频片段分别进行特征提取处理，得到文本特征和多个视频特征；调用基于多模态融合的视频片段检索模型基于文本特征和多个视频特征进行模态交互预测，得到预测结果，并基于预测结果确定多个目标待检索视频片段中与查询文本对应的目标视频片段，通过删除冗余帧以及层级化目标视频片段搜索，实现从海量视频中快速筛选出目标视频片段，有效提升了视频筛选的效率。

技术关键词

视频检索方法文本录像设备多模态融合特征非暂态计算机可读存储介质关键帧冗余软件开发工具包处理器特征提取模块检索装置关键词计算机程序产品匹配模块存储器电子设备图像

系统为您推荐了相关专利信息

一种基于超声内镜的炎症性肠病分析方法及系统

炎症性肠病患者超声内镜分析方法多模态数据融合特征值

图像生成方法及装置、图像生成模型训练方法及装置

图像生成模型大语言模型图像生成方法语义向量文本编码器

一种自然语言转SQL语句的方法

语句自然语言 BERT模型大语言模型行业知识图谱

将影像动画解算至无人机群舞步航路方法、设备及介质

动画视频影像无人机集群控制线性

基于数据合成和颜色空间学习的行人重识别方法

重识别方法颜色身份行人重识别模型数据

基于时空融合的多模态存量视频高效检索方法与装置

站点导航

APP 下载