摘要
本说明书一个或多个实施例提供一种视频问答方法、系统及任务解析方法、模型训练方法,该视频问答方法包括:向目标视频问答模型输入待解析视频、待解答问题和候选原子视频问答任务集合,并引导目标视频问答模型基于待解析视频将待解答问题分解为待解答原子视频问答任务集合;针对待解析视频,分别确定出待解答原子视频问答任务集合中的各候选原子视频问答任务对应的原子视频解析答案;向目标视频问答模型输入确定出的原子视频解析答案,以由目标视频问答模型根据获得的原子视频解析答案输出对应于待解答问题的最终视频解析答案。
技术关键词
问答模型
答案
视频问答方法
样本
解析方法
模型训练方法
协同系统
视频动作识别
规划
自然语言
处理器
对象跟踪
指令
问答系统
训练集
对象识别
计算机程序产品
摘要