摘要
本发明公开了一种基于时空Transformer与改进VGG16的课堂行为检测方法,该方法包括以下步骤:采集课堂监控视频并转换为包含时序信息的连续帧序列,构建涵盖10类具体行为的数据集;采用改进的VGG16网络提取空间特征,通过在第四、第五卷积块引入通道注意力模块(SE Block)增强关键特征表达,并结合多尺度特征金字塔(FPN)提升小目标检测能力;利用时空Transformer建模帧间时空依赖关系,捕捉学生动态行为的连续性;设计动态阈值机制,将检测结果自适应划分为“专注”“分心”“互动”“离座”四类行为状态,通过置信度得分和时序连续性优化分类准确性。
技术关键词
多尺度特征金字塔
阈值机制
分类阈值
连续性
学生
语义特征
注意力机制
序列
时序
动态
解码器架构
生成多尺度
前馈神经网络
编码器
视频
通道
积层
模块
系统为您推荐了相关专利信息
助教系统
人工智能程序
反馈子系统
资源库
个性化教学
语义分割网络
斜拉索
分割方法
图像增强方法
注意力