视频帧分类模型的训练方法、视频片段的检索方法及装置

正文

推荐专利

申请号：CN202510820233

申请日期：2025-06-18

公开号：CN120808226A

公开日期：2025-10-17

类型：发明专利

摘要

本申请实施例提供了一种视频帧分类模型的训练方法、视频片段的检索方法及装置，涉及视频处理技术领域，视频帧分类模型的训练方法包括：获取样本视频以及样本文本；将样本文本输入视频帧分类模型中的文本特征提取网络得到样本文本特征；将样本视频中的各待处理视频帧输入视觉特征提取网络，得到样本视觉特征；利用融合网络，基于注意力机制对样本文本特征和各样本视觉特征进行融合得到样本融合特征；将样本融合特征输入分类网络得到第一预测分类结果；根据第一预测分类结果与真实分类结果之间的差异对视频帧分类模型进行模型调参，直至达到模型收敛，得到训练完成的视频帧分类模型。通过本方案能够从视频中检索出符合用户描述的视频片段。

技术关键词

视频帧文本样本融合特征分类网络视觉特征提取注意力机制特征提取网络条件随机场算法检索方法实体矩阵特征提取模块计算机程序产品可读存储介质检索装置

系统为您推荐了相关专利信息

电缆故障辨识定位方法及装置、设备及存储介质

多源实测数据变电站电缆配置逻辑电缆沟道

一种基于跨域知识融合的应急决策支持方法

决策支持方法图谱概念维基百科知识抽取方法

一种面向知识检索的法律要素识别方法及系统

大语言模型识别方法多模态特征梯度下降法案件

一种异形玻璃基板镀膜厚度在线监测方法

异形玻璃厚度在线监测方法镀膜样本基板

用于生成视频的方法、装置、设备和产品

页面视频文本主题计算机程序产品

视频帧分类模型的训练方法、视频片段的检索方法及装置

站点导航

APP 下载