摘要
本申请涉及视频处理领域,公开了一种基于深度学习的视频内容分析方法。通过获取原始视频文件,将原始视频文件进行解码得到目标视频文件;对目标视频文件进行初步检测,获取目标视频文件的基本信息;依据目标视频文件的基本信息进行自适应采样,将目标视频文件转换为帧图像数组;采用时空金字塔注意力网络对镜头衔接点进行检测,依据检测到的镜头衔接点将帧图像数组切分为至少两个片段;采用动态对比学习框架,从每个片段中抽取关键帧图像;采用上下文感知的多任务学习网络对关键帧图像进行字幕移除处理,采用循环渐进式多模态对齐网络对关键帧图像生成图像描述。可以至少用以解决现有技术的局限性,提供更高效、更准确的视频内容分析解决方案。
技术关键词
视频内容分析方法
关键帧
多任务学习网络
图像
字幕
多模态
镜头
金字塔
计算机程序指令
动态
注意力
框架
校准技术
计算机程序产品
处理器
代表
电子设备
系统为您推荐了相关专利信息
三维模型
人体
医学图像处理
三维建模软件
复合材料
铁皮石斛病虫害
铁皮石斛组
特征提取模型
分类方法
样本
智能车位管理系统
管理终端
摄像头模块
智能车位管理方法
图像分析
路径优化方法
环境感知模型
动态
数据处理中心
导航路径优化