一种基于DMAAN的跨库语音情感识别方法及装置

正文

推荐专利

申请号：CN202410725624

申请日期：2024-06-06

公开号：CN118351887A

公开日期：2024-07-16

类型：发明专利

摘要

本申请公开了一种基于DMAAN的跨库语音情感识别方法及装置，方法包括：提取待识别语音样本的语谱图特征；将所述语谱图特征输入训练好的基于深度多层对抗自适应网络DMAAN的跨库语音情感识别模型，得到语音情感识别结果；模型的获取方法包括：从第一语音情感数据库和第二语音情感数据库中提取具有相同情感标签的语音样本，分别作为源域语音样本和目标域语音样本，并提取样本的语谱图特征；构建基于DMAAN的跨库语音情感识别模型，通过在原始分类损失函数中加入边缘分布适配损失和条件分布适配损失来指导训练，从而消除不同领域间的分布差异；结合总损失函数，使用源域语音样本的语谱图特征和目标域语音样本的语谱图特征对模型进行训练。识别准确率更好。

技术关键词

语音情感识别模型样本标签语谱图语音情感识别方法谱图特征情感分类器语音情感识别装置参数随机梯度下降网络计算方法处理器非线性指令滤波

一种基于DMAAN的跨库语音情感识别方法及装置

站点导航

APP 下载