一种多模态组合视频检索方法及装置

正文

推荐专利

一种多模态组合视频检索方法及装置

申请号：CN202510150950

申请日期：2025-02-11

公开号：CN120256679A

公开日期：2025-07-04

类型：发明专利

摘要

本申请实施例提供一种多模态组合视频检索方法及装置，包括：获取文字信息和视觉信息；从所述文字信息中提取文字特征；从所述视觉信息中提取视觉特征；根据所述文字特征，从所述视觉信息中提取视觉语义特征；从所述文字特征和视觉语义特征中提取所述文字特征和视觉语义特征之间的共同特征和差异特征；根据所述视觉特征和共同特征，查询预设的视频信息库，得到与所述视觉特征和共同特征匹配的多个视频检索结果；根据差异特征对多个视频检索结果进行筛选，得到筛选后的视频检索结果。本申请能够融合多模态信息的有效信息，准确理解用户的真实意图，提高多模态组合式视频检索的准确性。

技术关键词

语义特征文字特征视觉特征视频检索方法图像匹配融合多模态信息大语言模型视频检索装置指纹特征空间关系特征场景情感特征声纹特征音频特征模块纹理特征

系统为您推荐了相关专利信息

基于大语言模型语义能力的说话人日志任务优化方法

大语言模型语音活动检测日志自动语音识别文本

一种基于多模态的文本摘要生成方法

文本摘要生成方法多模态卷积神经网络提取文本生成模型语义特征

基于深度学习的社交媒体冒犯性内容识别方法及系统

内容识别系统多模态特征融合注意力机制内容识别方法特征提取模块

直播流中多人身份识别方法及其装置、设备、介质

人脸模板身份识别方法图像矩阵人脸跟踪检测

一种基于YOLOv8模型的枯叶检测方法、系统和设备

语义特征神经网络对图像像素数据存储计算机程序

一种多模态组合视频检索方法及装置

站点导航

APP 下载