基于跨时空融合注意力网络的语音情绪识别模型及方法

AITNT
正文
推荐专利
基于跨时空融合注意力网络的语音情绪识别模型及方法
申请号:CN202510791842
申请日期:2025-06-13
公开号:CN120496583A
公开日期:2025-08-15
类型:发明专利
摘要
本发明公开基于跨时空融合注意力网络的语音情绪识别模型及方法,属于语音处理与人工智能技术领域;基于跨时空融合注意力网络的语音情绪识别模型包括:频域特征提取模块、时域特征提取模块、特征融合模块和情绪分类模块;语音信号通过短时傅里叶变换和梅尔滤波组提取生成语谱图和梅尔频谱图,并作为频域特征提取模块的输入,来提取出频域特征;语音信号的eGeMAPS特征经帧级提取,形成时序特征矩阵,并输入时域特征提取模块,提取出时域特征;特征融合模块将频域特征和时域特征融合为统一高维特征;最后输入情绪分类模块,输出情绪类别。从而有效提升对多种复杂语音情绪的识别精度,具有良好的应用前景和推广价值。
技术关键词
语音情绪识别方法 时域特征提取 频域特征提取 时序特征 短时傅里叶变换 二维卷积神经网络 模块 拼接结构 时序依赖关系 多头注意力机制 对话机器人 通信接口 计算机存储介质
系统为您推荐了相关专利信息
1
一种基于AI智能体与电力设备仿真结合的闭环式故障诊断方法及装置
电力设备故障诊断 图谱 校验规则库 DTW算法 时序特征
2
基于大数据的新能源汽车高压线束热管理方法及系统
新能源汽车高压线 线束 管理方法 热管理 大数据
3
故障诊断方法、设备、介质和程序产品
计算机组件 时序特征 故障诊断方法 离散特征 长短期记忆神经网络
4
通用机场安全风险预测方法及风险等级评估方法
风险预测模型 风险等级评估方法 训练样本集 神经网络训练 风险预测方法
5
一种对心脏的血流动力学参数进行预测的处理方法和装置
血流动力学参数 序列 影像 心脏解剖结构 心脏磁共振
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号