一种基于多尺度时间序列动态建模的语音情感识别方法

正文

推荐专利

申请号：CN202510682467

申请日期：2025-05-26

公开号：CN120748452A

公开日期：2025-10-03

类型：发明专利

摘要

本发明提出了一种基于多尺度时间序列动态建模的语音情感识别方法，其构建的TSMDM‑Net网络模型包括时序卷积编码器、局部‑全局信息交互模块和分类器；所述时序卷积编码器通过动态膨胀因果卷积堆叠与残差归一化机制，逐步提取语音信号中的多尺度时序特征；所述局部‑全局信息交互模块分为局部信息模块和全局信息模块，通过动态路由策略进行局部与全局特征的互补性建模；利用训练集对TSMDM‑Net网络模型进行训练；利用测试集对训练后的TSMDM‑Net网络模型进行评估和优化；最终将待识别的音频数据输入至评估和优化后的TSMDM‑Net网络模型进行情感识别。该方法在捕捉语音信号中复杂时序依赖关系方面具有显著优势，有效提升了情感识别准确性。

技术关键词

语音情感识别方法卷积编码器信息模块多尺度残差归一化多头注意力机制动态情感类别局部注意力机制分类器序列时序特征时序依赖关系门控循环单元前馈神经网络声学特征

系统为您推荐了相关专利信息

基于微-宏关系构建的数据处理系统、方法、设备及介质

数据处理系统关系对象卷积模块多尺度

寒地风光发电功率多尺度融合预测方法

风光发电功率预测光伏发电功率预测数值天气预报风速多尺度萤火虫优化算法

变压器风险评估方法、装置、存储介质及电子设备

风险评估模型一维卷积神经网络朴素贝叶斯模型时空分布特征短时傅里叶变换

一种基于U-Net与图神经网络的烟田轮廓提取方法

烟田解码器轮廓提取方法网格多尺度特征提取

一种通用一体化水面图像增强与目标检测系统及方法

生成器网络分支输入多尺度检测识别模块检测器

一种基于多尺度时间序列动态建模的语音情感识别方法

站点导航

APP 下载