摘要
本发明公开了一种基于多模态的教学行为数据分类方法、装置、设备及介质,涉及教学行为分析领域,包括:采集视频和语音信息并进行预处理;对语音数据动态切割,识别讲解陈述行为;对对视频数据进行动作分析,识别展示行为和指导行为;通过识别疑惑表情特征和手势指向学生动作并检测疑问语音语调识别提问行为;利用知识图谱进行跨模态注意力权重分配并融合形成多模态融合特征;利用知识蒸馏迁移至边缘设备并输出教学行为分类结果。通过动态分割能避免分割相同或相近语义的语音片段;联合视频信息和语音信息进行提问行为识别提升了教学行为识别精确度;利用知识图谱根据教学环节提升不同数据来源的权重;通过知识蒸馏使得边缘设备也能满足算力需求。
技术关键词
教学
动态语义特征
数据分类方法
教师
语音
视频
融合特征
动作特征
面部表情分析
多模态特征
手势
蒸馏
骨骼关键点
计算机可执行指令
跨模态
系统为您推荐了相关专利信息
教学质量评价方法
高风险
学生
节点
生成自然语言
智能协同控制系统
可折叠显示面板
波束成形
矩形麦克风阵列
动态资源管理
手机语音识别
环卫车辆
手机蓝牙功能
识别语音命令
语音识别模块
云台控制方法
摄像模块
雷达模块
控制智能门锁
物体