一种语音情感识别方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411089230

申请日期：2024-08-09

公开号：CN118645124A

公开日期：2024-09-13

类型：发明专利

摘要

本申请提供了一种语音情感识别方法、装置、设备及存储介质，涉及语音信号处理技术领域，该方法首先使用预先训练好的语音识别自监督预训练模型提取帧级特征，从而缓解情感数据标注数据量不足的问题；其次利用局部原型映射网络，在不增加额外标注负担的情况下，在帧级层面通过无监督原型学习方法对帧级特征进行建模，有效刻画由语音情感复杂性所带来的局部统计信息变化并将其映射到相应的语音段表征上。综上所述，该方法通过结合预先训练好的语音识别自监督预训练模型和局部原型映射网络，为语音情感分析带来了显著的有益效果，提高了情感分析的准确性和效率，并具有较强的鲁棒性和泛化能力。

技术关键词

原型语音情感识别方法编码器特征提取器情感分类器监督学习模型语音情感识别装置语音信号处理技术预训练模型情感类别局部统计信息语音情感分析样本处理单元数据可读存储介质波形存储计算机程序学习方法

一种语音情感识别方法、装置、设备及存储介质

站点导航

APP 下载