视频理解方法、装置、电子设备、存储介质及程序产品

正文

推荐专利

申请号：CN202411638915

申请日期：2024-11-15

公开号：CN119600508A

公开日期：2025-03-11

类型：发明专利

摘要

本公开提供了视频理解方法、装置、电子设备、存储介质及程序产品，涉及深度学习、计算机视觉、大模型及自然语言处理等人工智能技术领域。具体实现方案为：对待处理视频进行镜头分割，得到待处理视频的至少一个镜头片段；分别对至少一个镜头片段进行目标运动幅度分析，得到至少一个镜头片段各自的运动幅度信息；基于至少一个镜头片段各自的运动幅度信息，从对应镜头片段中提取关键帧；基于至少一个镜头片段各自的关键帧的多模态特征，对待处理视频进行视频内容理解，得到待处理视频的描述信息。通过实施本公开实施例，可以优化视频理解效果。

技术关键词

镜头关键帧视频理解方法运动分析方法光流特征背景差分法大语言模型图像光流法像素点多模态特征分析单元动态成分分析分析模块电子设备

系统为您推荐了相关专利信息

一种短视频发布信息检测方法、系统、设备及介质

短视频信息检测方法关键帧音频特征多层感知机

一种集群航天器的意图识别方法及装置

集群航天器意图识别方法序列时间段速度

基于温度梯度追踪的大口径管道流量动态检测方法及系统

温度场监测系统温度传感器阵列注意力机制深度学习算法流量动态检测方法

一种球面超广角镜头

超广角镜头透镜球面凸面凹面

一种基于深度学习的旅游数据分析方法及系统

数据分析方法 DBSCAN算法物联网设备深度学习算法子模块

视频理解方法、装置、电子设备、存储介质及程序产品

站点导航

APP 下载