摘要
本申请提供一种语音情感的识别方法、装置、电子设备及计算机存储介质,通过集成了特征提取器、目标情感表征适配器和目标情感分配器的语音情感识别模型来对语音数据的情感进行识别,得到情感分类结果。在模型训练过程中,利用多样化的情景任务构建,模拟实际复杂场景中的域分布差异情况,并采用基于情景学习的策略提高实际复杂场景下的域泛化能力。具体而言,在预训练阶段引入了局部域分布对齐损失,减少域间情感特征的分布偏差,实现了情感特征的跨域对齐与融合。在微调阶段,使用解耦学习的方法,促使情感表征适配器和分类器能够逐步适应新的情感表达场景。从而有效的减小了域间差异对情感识别性能的影响,大幅提升了情感特征的鲁棒性与推广性。
技术关键词
语音情感识别模型
适配器
语音特征
分配器
识别方法
特征提取器
数据
计算机存储介质
情感特征
情感分类器
特征提取单元
编码器
电子设备
处理器
情景
识别装置
场景
存储装置
波形
系统为您推荐了相关专利信息
广义极值分布
像素点
识别方法
概率密度函数
概率分布函数
轨迹识别方法
历史轨迹数据
智慧社区
动态时间规整算法
聚类分析方法
图像对象特征
图像识别模型
图像识别方法
概念
视觉特征