基于深度学习的视频内容分析方法、设备、介质及产品

正文

推荐专利

申请号：CN202411904060

申请日期：2024-12-23

公开号：CN119763014A

公开日期：2025-04-04

类型：发明专利

摘要

本申请涉及视频处理领域，公开了一种基于深度学习的视频内容分析方法。通过获取原始视频文件，将原始视频文件进行解码得到目标视频文件；对目标视频文件进行初步检测，获取目标视频文件的基本信息；依据目标视频文件的基本信息进行自适应采样，将目标视频文件转换为帧图像数组；采用时空金字塔注意力网络对镜头衔接点进行检测，依据检测到的镜头衔接点将帧图像数组切分为至少两个片段；采用动态对比学习框架，从每个片段中抽取关键帧图像；采用上下文感知的多任务学习网络对关键帧图像进行字幕移除处理，采用循环渐进式多模态对齐网络对关键帧图像生成图像描述。可以至少用以解决现有技术的局限性，提供更高效、更准确的视频内容分析解决方案。

技术关键词

视频内容分析方法关键帧多任务学习网络图像字幕多模态镜头金字塔计算机程序指令动态注意力框架校准技术计算机程序产品处理器代表电子设备

系统为您推荐了相关专利信息

复合3D环保打印材料的人体肋骨骼替代物制造方法、设备、存储介质

三维模型人体医学图像处理三维建模软件复合材料

铁皮石斛病虫害智能检测与分类方法及系统

铁皮石斛病虫害铁皮石斛组特征提取模型分类方法样本

一种基于摄像头的智能车位管理系统、方法、设备及介质

智能车位管理系统管理终端摄像头模块智能车位管理方法图像分析

一种基于视觉检测的无人船路径优化方法

路径优化方法环境感知模型动态数据处理中心导航路径优化

文生图模型的训练方法、图像生成方法、装置和介质

样本文本图文策略大语言模型

基于深度学习的视频内容分析方法、设备、介质及产品

站点导航

APP 下载