一种视频理解的处理方法、装置、设备以及存储介质

正文

推荐专利

申请号：CN202510738183

申请日期：2025-06-04

公开号：CN120564105A

公开日期：2025-08-29

类型：发明专利

摘要

本申请提供一种视频理解的处理方法、装置、设备以及存储介质，属于视频理解的技术领域。所述方法包括获取目标视频和目标提问文本，并根据所述目标提问文本，生成视频段检索指示文本；将所述目标视频、目标提问文本和所述视频段检索指示文本输入所述粗粒度视频大语言模型，所述视频段检索指示文本用于指示所述粗粒度视频大语言模型在所述目标视频中提取与所述目标提问文本相关的关键片段；将所述粗粒度视频大语言模型输出的所述关键片段和所述目标提问文本输入所述细粒度视频大语言模型，所述细粒度视频大语言模型用于根据所述关键片段和所述目标提问文本输出最终回答。本申请旨在提高视频理解结果准确性。

技术关键词

大语言模型文本视频段非易失性可读存储介质样本强化学习策略视觉处理器存储器标签电子设备模块

系统为您推荐了相关专利信息

一种工业配方和工艺知识答案生成方法及装置

答案生成方法建立倒排索引工业命名实体识别节点

基于深度学习的变电站远程故障预警系统及方法

变电站运行数据重构误差编码器萤火虫优化算法故障预警方法

电池剩余容量估计方法、装置、设备及存储介质

电池充电数据充电截止电压电池剩余容量曲线样本

基于改进的ViT损失分布差异的对抗样本检测方法及系统

样本检测方法分层注意力样本检测系统特征加权融合损失函数优化

一种基于指纹色谱图谱的茶叶质量等级评定方法和系统

茶叶提取等级评定方法模式识别方法代谢指纹图谱指纹图谱建立

一种视频理解的处理方法、装置、设备以及存储介质

站点导航

APP 下载