摘要
本公开提供了一种动作识别的方法,其包括:根据关键帧确定第一输入图像,对多个视频帧分别下采样得到多个尺寸比所述第一输入图像的尺寸小的第二输入图像;所述关键帧为多个所述视频帧中的一帧;通过预设的动作识别模型对所述第一输入图像依次进行多级2D下采样得到多级2D特征,对多个所述第二输入图像依次进行多级3D下采样得到多级3D特征;通过所述动作识别模型确定多个特征组;每个所述特征组由所述2D特征和所述3D特征确定;通过所述动作识别模型对每个所述特征组进行解耦融合,得到对应的动作类型和动作位置。本公开还提供了一种动作识别的设备、计算机可读介质、计算机程序产品。
技术关键词
动作识别模型
关键帧
计算机程序产品
图像
特征金字塔网络
处理器
视频帧
尺寸
介质
存储器
模块
参数
系统为您推荐了相关专利信息
资源调用方法
综合评价指标
虚拟电厂控制
对象
场景
试卷
文字识别技术
智能阅卷系统
答案
大语言模型
水下图像处理方法
空域特征
图像处理模型
卷积模块
注意力