摘要
本申请提供了一种语音情感识别方法、装置、设备及存储介质,涉及语音信号处理技术领域,该方法首先使用预先训练好的语音识别自监督预训练模型提取帧级特征,从而缓解情感数据标注数据量不足的问题;其次利用局部原型映射网络,在不增加额外标注负担的情况下,在帧级层面通过无监督原型学习方法对帧级特征进行建模,有效刻画由语音情感复杂性所带来的局部统计信息变化并将其映射到相应的语音段表征上。综上所述,该方法通过结合预先训练好的语音识别自监督预训练模型和局部原型映射网络,为语音情感分析带来了显著的有益效果,提高了情感分析的准确性和效率,并具有较强的鲁棒性和泛化能力。
技术关键词
原型
语音情感识别方法
编码器
特征提取器
情感分类器
监督学习模型
语音情感识别装置
语音信号处理技术
预训练模型
情感类别
局部统计信息
语音情感分析
样本
处理单元
数据
可读存储介质
波形
存储计算机程序
学习方法