摘要
本发明涉及图像处理技术领域,提供了一种面向多目标学生的课堂行为识别方法,通过获取待识别课堂视频流,其中,待识别课堂视频流包含多个待识别课堂视频帧,将多个待识别课堂视频帧输入至课堂行为识别模型中,首先通过目标学生识别模块进行识别,识别待识别课堂视频帧中包含的各个目标学生,利用骨骼特征提取模块、头部姿态估计模块以及面部表情特征提取模块提取各个目标学生的骨骼点特征、头部姿态特征以及面部表情特征,并进行融合,解决了当有多个目标学生,若有目标学生被遮挡,无法获取被遮挡目标学生的特征信息的问题,最后通过分类模块确定多个目标学生的课堂行为,从而提高了面向多目标学生的课堂行为识别的准确性。
技术关键词
信息流特征
学生
姿态特征
面部表情特征提取
头部姿态估计
子模块
多模态特征融合
视频帧
特征提取模块
线性变换矩阵
融合特征
识别模块
骨骼特征
图片
视频流
识别方法
人体骨骼
系统为您推荐了相关专利信息
惯性传感器
加速度
预警方法
姿态特征
卡尔曼滤波
轻量化方法
蒸馏
交互注意力
适配器
Softmax函数
视频生成方法
融合姿态
视频生成模型
关节点
计算机可读指令