摘要
本申请提供一种视频数据处理方法、车辆、设备及程序产品,涉及计算机技术领域。在本申请可以对视频数据执行多维度的语义特征提取,得到视频数据的对象级语义特征、整图级语义特征和视频级语义特征等不同维度的语义特征。其中,对象级语义特征反映视频中出现的目标对象,整图级语义特征反映视频数据中的单个视频帧,视频级语义特征反映对视频数据中的视频段。由此,可以通过对应维度的语义特征执行多样化的检索,从而提高对视频数据的数据精度。此外,前述视频级语义特征可以基于视频帧的拼接图像确定,即前述各维度语义特征可以均基于图像进行提取,无需额外采用其他模态的模型进行语义提取,保证了各个维度语义特征的语义一致性。
技术关键词
视频帧
视频数据处理方法
语义特征提取
对象
车载监控系统
聚类
场景
图像拼接
处理器通信
指令处理器
代表
机器学习模型
存储器
计算机程序产品
系统为您推荐了相关专利信息
大语言模型
信息交互方法
对象
信息交互系统
教学
意图检测方法
文本
特征提取模块
前馈神经网络
分类器
轨迹误差
视频成像方法
重叠子孔径
成像算法
Kabsch算法
浓度预测方法
支持向量机模型
模糊隶属度函数
数据
时序
调速控制方法
功率变换电路
双曲正切函数
功率开关
高性能