视频理解问答方法、装置及存储介质

正文

推荐专利

视频理解问答方法、装置及存储介质

申请号：CN202510805662

申请日期：2025-06-16

公开号：CN120821871A

公开日期：2025-10-21

类型：发明专利

摘要

本申请公开了一种视频理解问答方法、装置及存储介质，属于问答技术领域。方法包括：获取视频数据和用户针对视频数据的问题；根据视频数据中视频帧之间的特征差异抽取多个关键帧图像；提取关键帧图像的图像特征以构建图像向量库，以及提取关键帧图像的内容信息以构建知识图谱和文本向量库；通过大语言模型基于图像向量库、知识图谱和文本向量库生成问题的答案。本申请通过构建图像向量库、知识图谱和文本向量库，不仅从视觉角度对视频内容进行量化描述，还通过知识图谱挖掘了视频内容的语义关系和逻辑结构，更全面深入地挖掘和整合视频语义知识，结合上述多模态数据联合推理，能够更全面地理解用户问题，提高了问答的准确性。

技术关键词

关键帧大语言模型构建知识图谱问答方法对象检测答案文本事件特征非暂态计算机可读存储介质知识图谱挖掘视频帧问答技术三元组图像编码器数据问答装置处理器

视频理解问答方法、装置及存储介质

站点导航

APP 下载