一种基于视频理解的交互式问答系统及其工作方法

正文

推荐专利

申请号：CN202510808458

申请日期：2025-06-17

公开号：CN120653799A

公开日期：2025-09-16

类型：发明专利

摘要

本发明属于人工智能技术领域，具体涉及一种基于视频理解的交互式问答系统及其工作方法。所述前端交互层，用于系统与用户交互互动；所述处理层，用于通过大模型实现基于视频理解的交互式问答；所述知识增强层，知识增强层内的内容以文本形式存储形成知识库，根据用户的问题和视频检索的结果进行二次检索，其检索结果和用户的问题、视频检索片段一起输入多模态大模型中，并生成最终回复；本发明针对无法动态响应用户自由提问、忽略视频画面与音频的语义信息以及缺乏对视频时序上下文的理解能力的问题。

技术关键词

交互式问答视频分析数据编码文本知识图谱查询多模态特征融合视频特征提取语音特征提取动态答案排序模型交互内容人工智能技术模块时序视觉特征

系统为您推荐了相关专利信息

一种流程管理方法及装置

策略计算机程序代码管理方法计算机程序产品计算机存储介质

一种基于专家知识优化的软件漏洞检测方法与系统

软件漏洞检测方法代码特征文本切片语句

歌词信息的处理方法及装置、存储介质、电子设备

歌词信息文本分词语义编辑距离算法

通过智能计算中心的算力修改图片的方法及装置

计算中心图片多模态意图编码

基于多级摘要生成的科技项目文档查重方法、设备及介质

文档查重方法摘要文本语义特征提取大语言模型

一种基于视频理解的交互式问答系统及其工作方法

站点导航

APP 下载