一种基于目标存在性的关键帧筛选和视频问答方法、装置及存储介质

正文

推荐专利

申请号：CN202511042436

申请日期：2025-07-28

公开号：CN120953872A

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了一种基于目标存在性的关键帧筛选和视频问答方法、装置及存储介质，包括：(1)对输入视频流以固定采样率进行均匀采样，生成时序连续的帧序列集合；(2)根据用户问题和输入视频流生成目标存在性表格，提示大语言模型根据目标存在性表格进行帧筛选，得到候选帧；(3)将候选帧按时间顺序拼接为单张合成图像，将拼接图像与问题输入大语言模型，输出精炼的关键帧序列；(4)将精炼的关键帧序列按照步骤(3)中的图像合成方法拼接成为单张合成图像，再将拼接图像与用户问题输入大语言模型，输出含答案选项、推理解释及置信度评分的JSON格式结构化响应。利用本发明，可以保全细粒度动态动作、消除帧筛选敏感性、增强视觉感知。

技术关键词

视频问答方法关键帧大语言模型视频流图像序列表格白色边框描述符采样率问答装置答案格式处理器时序可读存储介质视频帧视觉存储器

系统为您推荐了相关专利信息

一种生物标志物检测系统和方法

标志物检测芯片图像处理装置创伤性脑损伤图像采集装置

一种用于倾斜平台的无人机自主降落方法

单目相机地标模型预测控制算法轨迹规划算法坐标系

一种基于多模态数据的边坡自然地表点云语义分割方法

遥感图像数据点云语义分割方法融合特征特征提取模块点云特征

工件信息化载体DM码喷涂系统

工件识别装置喷涂系统工作状态显示装置输送链解码系统

基于时空协同的音乐表演姿态实时驱动方法及其系统

轻量化卷积神经网络时序特征坐标多尺度音乐

一种基于目标存在性的关键帧筛选和视频问答方法、装置及存储介质

站点导航

APP 下载