摘要
本发明公开了一种基于多视角图神经网络的课堂情绪识别方法,涉及深度学习和情绪识别技术领域,基于视觉特征、语音特征、文本特征,分别构建视觉模态图、语音模态图、文本模态图;各模态图中均以视频段作为节点,以每个视频段对应的视觉特征、语音特征、文本特征分别作为对应模态图的节点特征;利用图注意力网络分别对各模态图进行GAT编码,分别对各模态图中的节点特征进行更新,得到更新后的各模态图;基于更新后的各模态图进行多模态自适应融合,得到多模态自适应融合特征;利用多模态自适应融合特征预测学生的课堂情绪。本发明利用图神经网络构建多视角特征,结合多视角特征融合技术,更全面和准确的识别学生课堂情绪。
技术关键词
情绪识别方法
融合特征
语音特征
视觉特征
注意力
节点特征
多模态
视频段
多任务
多视角特征融合
邻居
情绪识别技术
语义
文本信息提取
线性变换矩阵
系统为您推荐了相关专利信息
检测网络模型
实时检测方法
自行车
注意力机制
电梯门机控制
运动想象训练
运动想象分类
注意力
算法模块
人机交互界面
图像生成模型
注意力
编码器
图像生成方法
卷积模块