视频内容推理方法、装置和系统

正文

推荐专利

视频内容推理方法、装置和系统

申请号：CN202510310902

申请日期：2025-03-14

公开号：CN120258133A

公开日期：2025-07-04

类型：发明专利

摘要

本发明实施例公开了一种视频内容推理方法、装置和系统。本发明实施例的视频内容推理方法、装置和系统通过增加预先训练的问题解析器，根据对于视频内容推理的问题文本生成对于视频进行处理的模块化执行策略，从时序和空间两个角度来分解推理任务，进而，通过时空定位模块来从视频数据中从时间和空间两个不同角度提取与问题文本相关的图像数据，进而根据图像数据以及问题文本来确定推理结果。由此，采用模块化执行策略可以为最终的推理模块提供更多关联的输入信息，提高推理的准确度，同时为最终结果提供可解释性。

技术关键词

时空定位模块时序解析器图像视频数据文本策略推理装置多模态推理方法计算机程序指令定位单元通用电子设备服务端计算机程序产品时间段关键帧

系统为您推荐了相关专利信息

列存储器电路、芯片、图像传感器及成像设备

存储器电路图像传感器数据传输模块采样模块存储体

一种格栅灯控制方法及相关装置

格栅灯驱动芯片图像坐标灯光控制

基于Mamba模型的遥感图像语义变化检测方法及装置

语义变化检测方法语义特征图像语义分类器变化检测模型

机场智能驱鸟方法、装置、系统及存储介质

机场智能空间定位信息驱鸟方法三角测量原理地图

裸眼3D图像生成方法、系统、电子设备及存储介质

图像生成方法多视角像素点生成三维图像信息成像

视频内容推理方法、装置和系统

站点导航

APP 下载