摘要
本发明提出了一种基于多尺度时间序列动态建模的语音情感识别方法,其构建的TSMDM‑Net网络模型包括时序卷积编码器、局部‑全局信息交互模块和分类器;所述时序卷积编码器通过动态膨胀因果卷积堆叠与残差归一化机制,逐步提取语音信号中的多尺度时序特征;所述局部‑全局信息交互模块分为局部信息模块和全局信息模块,通过动态路由策略进行局部与全局特征的互补性建模;利用训练集对TSMDM‑Net网络模型进行训练;利用测试集对训练后的TSMDM‑Net网络模型进行评估和优化;最终将待识别的音频数据输入至评估和优化后的TSMDM‑Net网络模型进行情感识别。该方法在捕捉语音信号中复杂时序依赖关系方面具有显著优势,有效提升了情感识别准确性。
技术关键词
语音情感识别方法
卷积编码器
信息模块
多尺度
残差归一化
多头注意力机制
动态
情感类别
局部注意力机制
分类器
序列
时序特征
时序依赖关系
门控循环单元
前馈神经网络
声学特征
系统为您推荐了相关专利信息
风光发电功率预测
光伏发电功率预测
数值天气预报风速
多尺度
萤火虫优化算法
风险评估模型
一维卷积神经网络
朴素贝叶斯模型
时空分布特征
短时傅里叶变换
生成器网络
分支
输入多尺度
检测识别模块
检测器