一种多标签提取和预筛选文本到视频的检索方法及系统

正文

推荐专利

申请号：CN202411693245

申请日期：2024-11-25

公开号：CN119917694B

公开日期：2025-12-02

类型：发明专利

摘要

本发明涉及多模态数据检索和跨模态对比学习技术领域，公开了一种多标签提取和预筛选文本到视频的检索方法及系统，包括：从文本和视频数据中提取标签，生成标签集，并对标签集进行筛选；对视频库中的视频和输入文本进行特征提取，生成视频和文本的多标签概率分布；构建标签至视频ID的倒排索引，并将生成的多标签概率分布与倒排索引中的标签进行匹配；根据输入文本标签集的匹配结果，匹配的相关视频。通过多标签提取和预筛选框架，将视频和文本数据转换为离散的语义标签，并结合倒排索引技术，实现了快速标签匹配和视频预筛选，有效降低了计算复杂度。

技术关键词

多标签检索方法文本编码器视频编码器视频特征提取检索算法生成倒排索引倒排索引技术倒排索引结构分类特征高频标签多模态语义标签检索系统转换器

系统为您推荐了相关专利信息

用于生产作业布防区的异常隐患判定优化方法及系统

跨模态融合特征振动监测数据生成轨迹异构传感器网络并行特征提取

多标签场景的分光器目标尾纤占用端口检测方法及装置

尾纤端口检测方法计算机执行指令多标签分光器

基于预训练扩散模型的多粒度提示金属表面缺陷图像合成方法

金属表面缺陷编码掩膜层级精度表面缺陷图像

对比语言图像模型的训练方法、装置、电子设备及介质

样本文本编码器图像编码器多层感知器跨模态学习

一种物资供应链电子数据检索方法及相关装置

电子数据检索系统数据检索方法大语言模型自然语言文本

一种多标签提取和预筛选文本到视频的检索方法及系统

站点导航

APP 下载