基于深度学习的视频内容分析方法、设备、介质及产品

AITNT
正文
推荐专利
基于深度学习的视频内容分析方法、设备、介质及产品
申请号:CN202411904060
申请日期:2024-12-23
公开号:CN119763014A
公开日期:2025-04-04
类型:发明专利
摘要
本申请涉及视频处理领域,公开了一种基于深度学习的视频内容分析方法。通过获取原始视频文件,将原始视频文件进行解码得到目标视频文件;对目标视频文件进行初步检测,获取目标视频文件的基本信息;依据目标视频文件的基本信息进行自适应采样,将目标视频文件转换为帧图像数组;采用时空金字塔注意力网络对镜头衔接点进行检测,依据检测到的镜头衔接点将帧图像数组切分为至少两个片段;采用动态对比学习框架,从每个片段中抽取关键帧图像;采用上下文感知的多任务学习网络对关键帧图像进行字幕移除处理,采用循环渐进式多模态对齐网络对关键帧图像生成图像描述。可以至少用以解决现有技术的局限性,提供更高效、更准确的视频内容分析解决方案。
技术关键词
视频内容分析方法 关键帧 多任务学习网络 图像 字幕 多模态 镜头 金字塔 计算机程序指令 动态 注意力 框架 校准技术 计算机程序产品 处理器 代表 电子设备
系统为您推荐了相关专利信息
1
复合3D环保打印材料的人体肋骨骼替代物制造方法、设备、存储介质
三维模型 人体 医学图像处理 三维建模软件 复合材料
2
铁皮石斛病虫害智能检测与分类方法及系统
铁皮石斛病虫害 铁皮石斛组 特征提取模型 分类方法 样本
3
一种基于摄像头的智能车位管理系统、方法、设备及介质
智能车位管理系统 管理终端 摄像头模块 智能车位管理方法 图像分析
4
一种基于视觉检测的无人船路径优化方法
路径优化方法 环境感知模型 动态 数据处理中心 导航路径优化
5
文生图模型的训练方法、图像生成方法、装置和介质
样本 文本 图文 策略 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号