一种多任务语音情感识别方法、装置和存储介质

正文

推荐专利

申请号：CN202411028482

申请日期：2024-07-30

公开号：CN118553271B

公开日期：2024-10-15

类型：发明专利

摘要

本发明提供了一种多任务语音情感识别方法、装置和存储介质，涉及语音处理领域，包括：增强语音高频部分；将连续的语音信号分割成多个片段，得到分帧语音；采用加窗函数处理分帧语音，得到加窗语音；提取加窗语音的梅尔频率倒谱系数和梅尔频谱图；基于神经网络模型提取梅尔频谱图和梅尔频率倒谱系数的语音特征；在多粒度层面捕捉情感信息，得到情感信息的特征嵌入；基于信息瓶颈原理，降低多任务特征嵌入中的冗余信息；将说话人信息的特征嵌入和性别信息的特征嵌入通过感知聚合模块进行聚合，并与情感信息的特征嵌入相结合，最终输入到分类器中，以预测所述待识别语音所表达的情感。能够提升语音识别系统的情感识别能力。

技术关键词

语音情感识别方法多任务语音特征梅尔频率倒谱系数神经网络模型语音情感识别装置注意力机制分类器长短期记忆网络语音识别系统存储程序指令表达式瓶颈可读存储介质情感特征时序特征冗余

系统为您推荐了相关专利信息

一种基于图对比学习的鲁棒协同过滤方法和装置

神经网络模型样本贝叶斯个性化排序节点对象

一种基于物联网的换相设备选址定容规划管理系统和方法

换相设备选址定容规划指数机器学习算法地理信息数据

一种面向航天器的多任务数据集构建方法

数据集构建方法面向航天器卫星模型图像自动标注方法多任务

一种疾病标志物表达调控网络的关键节点识别方法

关键节点识别方法差异表达基因构建基因表达网络拓扑特征疾病标志物技术

一种地基SAR边坡测量数据去噪方法

SAR图像序列数据去噪方法风险神经网络模型标识

一种多任务语音情感识别方法、装置和存储介质

站点导航

APP 下载