摘要
本发明公开了基于Mel语谱图特征及SSA‑TFSCNet的语音情感识别方法及系统,方法如下:S1.将音频信号提取为一维时序信号并进行预处理,得到每个音频对应的Mel语谱图,划分成训练集和验证集;S2.构建基础网络TFSC的基本框架,结合双重注意力机制,搭建可变参数的TFSCNet模型;S3.将训练集和TFSCNet模型输入SSA算法进行训练,并设置利用SSA算法寻参时TFSCNet模型的参数范围,利用验证集进行验证,通过SSA算法获得TFSCNet模型的最优参数;S4.将SSA算法寻得的最优参数应用于TFSCNet模型中,得到参数固定的TFSCNet模型;S5.将训练集数据输入TFSCNet模型进行训练,并用验证集进行验证,若符合验证条件的,停止训练,保存最佳模型;S6.将待测试语音信号进行处理生成Mel语谱图后,输入最佳模型,得到预测情感。
技术关键词
语音情感识别方法
SSA算法
训练集数据
参数
注意力机制
代表
频率
语音情感识别系统
位置更新
情感特征
音频
情感识别模型
短时傅里叶变换
信号
模块
ReLU函数
网络
索引
多层感知机
系统为您推荐了相关专利信息
广义正交匹配追踪算法
谐波
传感方法
矩阵
短时傅里叶变换
插件
分布式并行计算
训练分类器
信号处理模块
计算机