基于多模态信息增强的弱监督视频片段检索方法，设备及介质

正文

推荐专利

申请号：CN202411901195

申请日期：2024-12-23

公开号：CN119829797A

公开日期：2025-04-15

类型：发明专利

摘要

本发明涉及一种基于多模态信息增强的弱监督视频片段检索方法，设备及介质，将未剪辑视频和查询文本输入到输入表示模块，得到视频特征和查询文本特征；同时将未剪辑视频输入场景分布检测模块中对视频帧进行聚类，得到场景特征。将视频特征、查询文本特征和场景特征输入提议片段生成模块，得到预测的候选提议片段。将候选提议片段输入提议片段增强模块中，得到多模态增强的片段特征。在提议片段评估模块中计算片段特征的查询文本重建损失和查询文本标签相似性损失，选取损失最小的片段作为检索结果，输出片段的开始和结束时间。与现有技术相比，本发明具有准确性高、时效性强和有效性强等优点。

技术关键词

视频片段检索方法多模态信息文本场景特征样本标签特征上下文语义信息卷积神经网络提取对象检测模型模块层次聚类算法跨模态时序结构多层感知器视频帧运动检测

系统为您推荐了相关专利信息

基于多任务主动学习框架的鱼类投喂方法和装置

多任务学习模型主动学习框架查询策略推理网络样本

一种线粒体营养素羊奶粉基于图像处理的质量检测方法

反射率数据对象滑动窗口羊奶粉样本

基于SAM的致密砂岩图像孔隙标注方法及系统

致密砂岩标注系统图像编码器语义特征标注方法

一种基于文本描述的不可见物体4D人物交互生成方法

关键帧物体人体运动模型重建人体交互注意力

一种融合动量对比学习和Transformer的网络攻击检测方法

网络攻击检测方法灰狼优化算法表达式样本编码器

基于多模态信息增强的弱监督视频片段检索方法，设备及介质

站点导航

APP 下载