一种基于Transformer与改进VGG16模型的学生课堂行为检测方法

AITNT
正文
推荐专利
一种基于Transformer与改进VGG16模型的学生课堂行为检测方法
申请号:CN202510344950
申请日期:2025-03-24
公开号:CN120236239A
公开日期:2025-07-01
类型:发明专利
摘要
本发明公开了一种基于时空Transformer与改进VGG16的课堂行为检测方法,该方法包括以下步骤:采集课堂监控视频并转换为包含时序信息的连续帧序列,构建涵盖10类具体行为的数据集;采用改进的VGG16网络提取空间特征,通过在第四、第五卷积块引入通道注意力模块(SE Block)增强关键特征表达,并结合多尺度特征金字塔(FPN)提升小目标检测能力;利用时空Transformer建模帧间时空依赖关系,捕捉学生动态行为的连续性;设计动态阈值机制,将检测结果自适应划分为“专注”“分心”“互动”“离座”四类行为状态,通过置信度得分和时序连续性优化分类准确性。
技术关键词
多尺度特征金字塔 阈值机制 分类阈值 连续性 学生 语义特征 注意力机制 序列 时序 动态 解码器架构 生成多尺度 前馈神经网络 编码器 视频 通道 积层 模块
系统为您推荐了相关专利信息
1
一种基于增量学习的在线学习方法及系统
在线学习方法 数据 学生 教师 深度学习模型
2
一种基于组上下文一致性的弱半监督遥感影像车辆检测方法
车辆检测方法 教师 学生 标签 关系
3
一种针对低轨小型化暗弱卫星的精确跟踪方法
跟踪方法 伺服控制系统 相机 轨道 光学成像系统
4
一种生成式人工智能助教系统及装置
助教系统 人工智能程序 反馈子系统 资源库 个性化教学
5
一种基于深度学习的高精度轻量化斜拉索表观病害分割方法及系统
语义分割网络 斜拉索 分割方法 图像增强方法 注意力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号