摘要
本发明属于视频问答领域,尤其涉及一种基于聚合‑剪枝采样的视频问答方法。针对现有本发明是为了解决长视频问答中因时空噪声导致的视觉信息冗余导致,导致现有的视频问答系统在进行长视频问答时,回答的答案存在准确率低问题,从而提出一种“聚合‑剪枝采样器(APSam)”,有效提升长视频问答的准确性和推理能力,专注于聚合与问题相关的相似标记,以多样化特征粒度,并在每个问题条件下自适应地剪枝视觉噪声,从而解决了现有的视频问答系统在进行长视频问答时,回答的答案存在准确率低问题,提高了问答准确性。
技术关键词
视觉特征
视频问答方法
问答模型
补丁
标记
采样器
动态
剪枝器
文本编码器
视频编码器
问答系统
答案
矩阵
网络
训练集
模块
索引
系统为您推荐了相关专利信息
数据标注系统
人机协同
AI服务器
模块
数据标注方法
超声图像分割方法
图像分割模型
融合特征
信道
池化特征
网络机器人
客户端设备
页面内容
识别方法
访问控制列表
建筑物轮廓线
机载激光雷达点云数据
机载激光雷达数据处理技术
种子
直线