一种基于层次化选择框架的视频问答建模方法

正文

推荐专利

申请号：CN202510077986

申请日期：2025-01-17

公开号：CN119884417B

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了一种基于层次化选择框架的视频问答建模方法，其特征在于，首先进行视频数据和文本数据预处理，得到视频片段特征、物体特征、物体特征、问题特征、问题词特征和候选答案特征作为视频问答模型的输入；根据时间跨度和空间跨度从大到小层次化地选择视频片段特征、视频帧特征和物体特征，然后与问题特征进行特征融合，实现对答案的预测。本发明方法可以和不同的预训练模型结合训练与微调，即插即用；能够层次化地选择与问题相关的视频片段、视频帧和物体特征，实现问题相关关键特征的提取，以及对无关冗余信息的过滤。

技术关键词

视频帧特征词特征建模方法物体问答模型答案语言编码器视觉特征模块框架融合特征数据跨模态矩阵线型文本图像线性

系统为您推荐了相关专利信息

一种CPA优化BP神经网络主轴热误差建模方法

优化BP神经网络主轴热误差建模方法神经网络模型高速电主轴

机器人运动控制方法、计算机设备及计算机存储介质

机器人脚部机器人运动控制方法加速度关节计算机存储介质

一种脑电与图片联合编码实现手部精细动作运动想象的方法

脑电信号采集设备编码器图片解码器运动

一种装配式空间网格结构有限元模型的参数化生成方法

空间网格结构装配式节点有限元分析模型参数化生成方法杆件尺寸

海底采矿矿区的建模方法、装置、电子设备及存储介质

三维地质模型土体参数建模方法网格协方差矩阵

一种基于层次化选择框架的视频问答建模方法

站点导航

APP 下载