摘要
本申请公开了一种面向语音情感识别的局部属性学习方法及装置,该方法为:利用特征提取结构,获得无监督语音数据的通用特征;利用局部特征适配器,对通用特征进行处理,获得适配情感语音数据的局部特征;基于第二特征,确定对应的属性学习损失;基于第一特征以及多个局部属性,确定多个概率值;基于多个概率值,确定对应的局部属性对比损失;基于属性学习损失和局部属性对比损失,确定目标模型的损失函数。该方法基于属性学习损失以及局部属性损失作为目标模型的损失函数,能够在语音情感数据量不足的情况下,通过对目标模型提取的局部特征进行深入建模,精确捕捉语音情感复杂性所带来的局部统计信息变化,从而提升目标模型的语音情感识别性能。
技术关键词
面向语音情感识别
适配器
属性学习方法
通用特征
前馈神经网络
无监督
编码器
局部统计信息
一维卷积神经网络
语音特征
注意力
特征提取单元
数据
处理器
波形
学习装置
程序
存储器