摘要
本发明公开一种基于改进Mask RCNN的课堂师生视频分类方法及系统,涉及师生行为分类技术领域。所述方法包括:采集课堂师生交互的场景影像,并对场景影像进行语义标注,将各课堂动作及对应的语义标注信息确定为基准数据集;构建预训练网络;利用基准数据集对预训练网络进行迭代优化训练,并将训练好的预训练网络确定为最终的课堂师生视频分类模型;其中,课堂师生视频分类模型包括互相连接的Mask RCNN网络和Swin Transformer网络;利用课堂师生视频分类模型对待检测影像数据进行检测,得到待检测影像数据对应的课堂动作识别分类结果。本发明能够结合学生与教师的行为动作进行分类评估,并提高分类评估准确性。
技术关键词
视频分类模型
视频分类方法
预训练网络
影像
语义
优化器
场景
基准
视频分类系统
教师
学生
展示教具
数据采集单元
分类边界
分类技术
标注工具
老师
图像
系统为您推荐了相关专利信息
蒙特卡洛树搜索
节点
大语言模型
抽象语法树
逻辑
图像编码器
图像处理模型
图文
知识蒸馏方法
文本编码器
三维数字模型
地质钻探
数字高程模型
仿真模型
隧道
数据处理方法
智能调控方法
智能调控系统
加权融合算法
数据项
数据存储方法
空间查询方法
点云
三维空间数据存储技术
索引