摘要
本发明公开一种基于有监督对比学习的语音情感识别方法,包括以下步骤:获取包含多种情感类别的大规模语音数据集,对语音数据进行系统化的预处理和情感标注,以构建高质量的训练数据集;构建基于情感锚点生成模块、话语情感表征模块、对比学习模块及情感锚点自适应模块的语音情感识别模型;使用步骤1中构建的数据集对所述情感识别模型进行训练;将待识别的目标语音输入训练好的模型,通过计算话语情感表征与最接近的情感锚点之间的相似度,从而得到最终的情感预测结果。本发明所提出的方法通过采用有监督对比学习的方法,解决了相似情感难以区分的问题;同时,本发明不仅能够提升情感识别准确性,还增强了模型的泛化能力。
技术关键词
语音情感识别方法
情感类别
锚点
语音情感识别模型
大规模语音数据
情感特征
语音编码器
模块
样本
超参数
标签文本
音频
代表
表达式