基于视觉语言模型的视频分析方法

正文

推荐专利

基于视觉语言模型的视频分析方法

申请号：CN202411906399

申请日期：2024-12-23

公开号：CN119763015B

公开日期：2025-12-05

类型：发明专利

摘要

本发明提供一种基于视觉语言模型的视频分析方法，该方法包括：获取待分析视频；遍历所述待分析视频中的各视频帧，在当前遍历的视频帧为关键帧的情况下，将所述关键帧和与所述关键帧对应的各非关键帧的第一识别结果输入视觉语言模型中，得到所述视觉语言模型输出的所述关键帧的第二识别结果，所述第一识别结果为在确定所述非关键帧的图像类型后，将所述非关键帧输入所述图像类型对应的图像识别模型中得到的非关键帧的识别结果，所述图像识别模型为基于所述图像类型对应的第一样本图像和所述第一样本图像的识别结果标签训练得到的；基于所述第二识别结果，确定所述待分析视频的视频分析结果。本发明能够提高视觉语言模型的视频分析结果的准确性。

技术关键词

关键帧视频分析方法图像识别模型视觉图像分类模型可见光图像视频帧人脸景深样本图像块标签标识

系统为您推荐了相关专利信息

社交媒体综合舆情分析方法及相关装置

舆情分析方法舆情分析系统跨模态情感分析模型话题

一种超写实数字人视频检测方法及其系统

运动特征运动编码器视频检测方法二分类模型通用特征

一种堵塞溜井本质安全智能破拱一体化装置及方法

激光三维扫描仪激光引导装置高清摄像头遥控电动车一体化装置

基于分时规划与雷视融合的路径优化选择方法及系统

激光雷达数据决策支持模型规划可变形卷积网络视觉

一种道路地图中道路标志元素的构建方法及构建装置

道路标志元素采集设备地图机器可读指令

基于视觉语言模型的视频分析方法

站点导航

APP 下载