摘要
一种跨模态注意力融合的教学语音情感识别方法,由划分语音情感数据集、微调预训练模型、构建语音情感分类网络、训练语音情感分类网络、测试语音情感分类网络组成。本发明的语音情感分类网络的4个学习模块将语音特征和语义特征融合形成情感信息的融合特征;拼接融合特征输入全连接分类模块进行语音情感识别。采用本发明方法与现有的语音情感识别进行了对比仿真实验,实验结果表明,本发明方法语音情感识别的准确率为78.14%,能够有效地识别课堂教学环境下教师语音的情感,与现有技术相比,本发明具有语音特征、语义特征、情感识别结果准确等优点。可用于分析教师课堂教学过程中情感变化对教学活动的影响。
技术关键词
语音情感识别方法
分类网络
跨模态
语义特征
特征谱图
情感类别
语音特征
注意力机制
预训练模型
课堂教学环境
教师课堂教学
服务器显卡
融合特征
模块
数据
输入端
系统为您推荐了相关专利信息
联想词汇
语音评估方法
节点特征
语音评估系统
语义层次结构
三维可视化引擎
识别平台
混合深度学习
裂缝
分布式传感器网络