基于跨时空融合注意力网络的语音情绪识别模型及方法

正文

推荐专利

申请号：CN202510791842

申请日期：2025-06-13

公开号：CN120496583A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开基于跨时空融合注意力网络的语音情绪识别模型及方法，属于语音处理与人工智能技术领域；基于跨时空融合注意力网络的语音情绪识别模型包括：频域特征提取模块、时域特征提取模块、特征融合模块和情绪分类模块；语音信号通过短时傅里叶变换和梅尔滤波组提取生成语谱图和梅尔频谱图，并作为频域特征提取模块的输入，来提取出频域特征；语音信号的eGeMAPS特征经帧级提取，形成时序特征矩阵，并输入时域特征提取模块，提取出时域特征；特征融合模块将频域特征和时域特征融合为统一高维特征；最后输入情绪分类模块，输出情绪类别。从而有效提升对多种复杂语音情绪的识别精度，具有良好的应用前景和推广价值。

技术关键词

语音情绪识别方法时域特征提取频域特征提取时序特征短时傅里叶变换二维卷积神经网络模块拼接结构时序依赖关系多头注意力机制对话机器人通信接口计算机存储介质

系统为您推荐了相关专利信息

一种基于AI智能体与电力设备仿真结合的闭环式故障诊断方法及装置

电力设备故障诊断图谱校验规则库 DTW算法时序特征

基于大数据的新能源汽车高压线束热管理方法及系统

新能源汽车高压线线束管理方法热管理大数据

故障诊断方法、设备、介质和程序产品

计算机组件时序特征故障诊断方法离散特征长短期记忆神经网络

通用机场安全风险预测方法及风险等级评估方法

风险预测模型风险等级评估方法训练样本集神经网络训练风险预测方法

一种对心脏的血流动力学参数进行预测的处理方法和装置

血流动力学参数序列影像心脏解剖结构心脏磁共振

基于跨时空融合注意力网络的语音情绪识别模型及方法

站点导航

APP 下载