摘要
本发明提供了一种用于车载环境的语音情绪识别方法,包括:在录音室环境下获取语音情绪数据集及其对应的实际标签,从而得到训练集;使用训练集对初始模型进行训练获得教师模型并得到对应的第一标签向量;基于知识蒸馏技术,使用训练集并通过教师模型作为辅助对初始模型进行训练获得学生模型,并得到对应的第二标签向量,其中,学生模型的层数小于所述教师模型的层数;基于第一标签向量与第二标签向量计算蒸馏损失,基于第二标签向量与实际标签计算学生损失,从而得到训练时的总损失;将目标语音片段输入学生模型判断目标语音片段的情绪类别及情绪维度值。本发明解决了初始模型过于庞大导致算力成本高的问题。
技术关键词
语音情绪识别方法
标签
学生
语音识别程序
知识蒸馏技术
录音室
教师
卷积神经网络模块
训练集
注意力机制
多层感知机
信噪比
数据
存储器
麦克风
处理器
系统为您推荐了相关专利信息
节点
关系
智能体模型
连线
非易失性计算机存储介质
网络拓扑特征
偏最小二乘回归模型
评估装置
生成树
谱分析方法
视网膜图像分层
计算机可执行指令
模型训练方法
训练集
标签
信息生成方法
表单
大语言模型
生成样本数据
信息生成装置