面向多场景体育视频的镜头分割方法、设备和存储介质

正文

推荐专利

申请号：CN202510676372

申请日期：2025-05-24

公开号：CN120580619A

公开日期：2025-09-02

类型：发明专利

摘要

面向多场景体育视频的镜头分割方法、设备和存储介质,首先基于多种体育场景的视频内容，构建具有明确语义信息的细粒度相机镜头分割数据集，然后利用自监督视频特征提取模型VideoMAE对输入视频进行编码，获得帧级视觉语义特征；最后构建基于空洞时间卷积与层次化注意力机制的编码器‑解码器结构的镜头分割模型，通过编码器建模局部时间上下文，解码器多阶段细化输出帧级镜头分类结果。本发明实现对体育视频中复杂镜头类别的准确分割，实验结果表明所提出模型在所述数据集上获得优异的分割精度与时序一致性。本发明可为视频内容理解、自动剪辑、体育视频分析等任务提供技术支撑，并推动基于语义理解的视频结构分析研究的发展。

技术关键词

镜头分割方法面向多场景编码器体育计算机可执行程序空洞特写镜头解码器结构相机镜头视频特征提取交叉注意力机制缩放镜头语义全景镜头类别分布概率局部注意力机制

系统为您推荐了相关专利信息

一种基于大数据的教育综合评估的方法及系统

语义学生大数据体育分词

一种快速鉴别肠出血性大肠杆菌O157菌株的无标记SERS检测方法

SERS检测方法肠出血性大肠杆菌标记分类准确率朴素贝叶斯

一种同轨道双机器人防撞系统及方法

上料机器人下料机器人信息采集单元双机器人防撞方法

混合专家模型的优化方法及装置

网络分配内存样本矩阵编码器

基于多源遥感影像融合的地表水网提取方法、系统、存储介质和电子设备

多源遥感影像散射特征空间金字塔池化地表水融合特征

面向多场景体育视频的镜头分割方法、设备和存储介质

站点导航

APP 下载