视频内容推理方法、装置和系统

AITNT
正文
推荐专利
视频内容推理方法、装置和系统
申请号:CN202510310902
申请日期:2025-03-14
公开号:CN120258133A
公开日期:2025-07-04
类型:发明专利
摘要
本发明实施例公开了一种视频内容推理方法、装置和系统。本发明实施例的视频内容推理方法、装置和系统通过增加预先训练的问题解析器,根据对于视频内容推理的问题文本生成对于视频进行处理的模块化执行策略,从时序和空间两个角度来分解推理任务,进而,通过时空定位模块来从视频数据中从时间和空间两个不同角度提取与问题文本相关的图像数据,进而根据图像数据以及问题文本来确定推理结果。由此,采用模块化执行策略可以为最终的推理模块提供更多关联的输入信息,提高推理的准确度,同时为最终结果提供可解释性。
技术关键词
时空定位模块 时序 解析器 图像 视频 数据 文本 策略 推理装置 多模态 推理方法 计算机程序指令 定位单元 通用电子设备 服务端 计算机程序产品 时间段 关键帧
系统为您推荐了相关专利信息
1
列存储器电路、芯片、图像传感器及成像设备
存储器电路 图像传感器 数据传输模块 采样模块 存储体
2
一种格栅灯控制方法及相关装置
格栅灯 驱动芯片 图像 坐标 灯光控制
3
基于Mamba模型的遥感图像语义变化检测方法及装置
语义变化检测方法 语义特征 图像 语义分类器 变化检测模型
4
机场智能驱鸟方法、装置、系统及存储介质
机场智能 空间定位信息 驱鸟方法 三角测量原理 地图
5
裸眼3D图像生成方法、系统、电子设备及存储介质
图像生成方法 多视角 像素点 生成三维图像信息 成像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号