摘要
本申请公开了一种维度语音情感识别方法、计算机装置、介质、产品。其中,方法包括:基于待识别语音,获取目标语音发音特征;基于预设提取策略从待识别语音中提取听觉调制耳蜗图特征;基于预设模型对待识别语音进行分析,提取预训练模型特征;对目标语音发音特征、听觉调制耳蜗图特征、预训练模型特征进行时序编码,形成三类编码特征,然后进行加权处理,获得三类加权特征;然后进行多任务识别,获得离散情感识别信息、维度情感初始识别信息;基于预设损失计算策略对这两类信息进行处理,获得维度语音情感目标识别结果。该方法能够有效缩小现有技术中表征空间和实际情感空间之间的差距,通过全面、细致的分析,能够获得准确、可靠的情感识别结果。
技术关键词
语音情感识别方法
发音特征
预训练模型
计算机装置
加权特征
声道
情感类别
编码特征
听觉
多任务
皮尔逊相关系数
滤波器系数
处理器
可读存储介质
信号
指令
策略
系统为您推荐了相关专利信息
带钢表面缺陷
网络结构
通道注意力机制
特征金字塔
数量化方法
数据
障碍物识别方法
池化特征
注意力模型
障碍物检测系统
油气井增产措施
时序
参数
时间识别方法
预训练模型