摘要
本发明设计一种基于非线性时空相对位置偏置的视频动作检测方法,其特征在于,方法包括以下步骤:获取视频数据;将视频数据输入基于Transformer的视频动作检测模型,基于目标点和参考点采用非线性变换计算立方体的相对坐标;输出每个维度的非线性偏置,计算改进的相对位置偏置B,注意力机制输出关键时空特征;关键时空特征输入模型的分类模块,得到视频动作检测结果。与现有技术相比,本发明具有提高动作检测的精度的同时减少计算量等优点。
技术关键词
视频动作检测方法
非线性
动作检测模型
坐标
立方体
注意力机制
多层感知机
金字塔网络
多尺度特征
网格
数据
序列
融合特征
标记
上采样
模块
解码器
编码
矩阵
系统为您推荐了相关专利信息
扰动识别方法
电能
残差网络模型
注意力
Adam算法
动作捕捉系统
影音系统
运动平台
训练数据处理方法
场景
浅层特征提取
多尺度特征
图像超分辨率重建
通道注意力机制
深层特征提取