摘要
本申请提供一种视频处理方法、装置及设备,涉及计算机视觉技术领域,用于提高对视频动作检测的准确性。该视频处理方法包括:根据待检测视频的第一融合特征和预设的特征增强网络,对第一融合特征进行全局时间上下文信息和局部时间上下文信息特征提取,获得待检测视频的全局特征和局部特征,第一融合特征包括待检测视频的空间流特征和时间流特征;根据全局特征和局部特征,结合预设的边界预测网络,对待检测视频中每个动作进行边界定位,确定每个动作对应的视频片段。
技术关键词
时间流特征
融合特征提取
视频帧
卷积神经网络提取
多头注意力机制
时序
计算机视觉技术
可读存储介质
特征提取模块
分支
计算机程序产品
指令
序列
处理器通信
存储器
系统为您推荐了相关专利信息
CART决策树
位置编码信息
混合学习模型
数据
分类预测模型
机器人工作站
视觉检测方法
视频帧
算法模型
实时视频流
图像视觉特征向量
视频帧
视频剪辑方法
计算机程序指令
多模态
警示方法
设备状态数据
三维地图数据
动态
警示灯牌