一种基于动态位置嵌入的课堂完备元动作识别方法

正文

推荐专利

申请号：CN202410825570

申请日期：2024-06-25

公开号：CN118823636A

公开日期：2024-10-22

类型：发明专利

摘要

本发明公开了一种基于动态位置嵌入的课堂完备元动作识别方法，包括：得到单个学生课堂元动作视频、对视频进行关键帧采样；构建由动态位置嵌入的位置编码模块、Video Swin Transformer基本模块、ViT3D基本模块组成的课堂完备元动作识别模型，依次获得动态位置特征表示、多个局部注意力向量、元动作类别概率向量、对课堂完备元动作识别模型进行迭代优化；将预处理后学生课堂元动作视频输入该模型获得课堂学生元动作类别。这种方法不仅使用动态位置嵌入方法进行条件位置编码结合深度卷积网络以提升对元动作空间结构的解析能力，并采用ViT3D的全注意力机制提取动作的潜在空间特征，捕捉元动作的全局时空信息，从而提升课堂视频的学生完备元动作识别准确率。

技术关键词

动作识别模型动作识别方法学生编码模块动态视频帧 Softmax函数深度卷积网络嵌入方法多层感知机矩阵注意力机制空间结构高清关键帧优化器数据

一种基于动态位置嵌入的课堂完备元动作识别方法

站点导航

APP 下载