基于Mel语谱图特征及SSA-TFSCNet语音情感识别方法及系统

正文

推荐专利

申请号：CN202511160982

申请日期：2025-08-19

公开号：CN120954456A

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了基于Mel语谱图特征及SSA‑TFSCNet的语音情感识别方法及系统，方法如下：S1.将音频信号提取为一维时序信号并进行预处理，得到每个音频对应的Mel语谱图，划分成训练集和验证集；S2.构建基础网络TFSC的基本框架，结合双重注意力机制，搭建可变参数的TFSCNet模型；S3.将训练集和TFSCNet模型输入SSA算法进行训练，并设置利用SSA算法寻参时TFSCNet模型的参数范围，利用验证集进行验证，通过SSA算法获得TFSCNet模型的最优参数；S4.将SSA算法寻得的最优参数应用于TFSCNet模型中，得到参数固定的TFSCNet模型；S5.将训练集数据输入TFSCNet模型进行训练，并用验证集进行验证，若符合验证条件的，停止训练，保存最佳模型；S6.将待测试语音信号进行处理生成Mel语谱图后，输入最佳模型，得到预测情感。

技术关键词

语音情感识别方法 SSA算法训练集数据参数注意力机制代表频率语音情感识别系统位置更新情感特征音频情感识别模型短时傅里叶变换信号模块 ReLU函数网络索引多层感知机

系统为您推荐了相关专利信息

一种鱼脊型薄壁连续刚构渡槽结构及其设计方法

连续刚构渡槽变高度承重结构输水墩柱

高次谐波压缩传感方法及装置

广义正交匹配追踪算法谐波传感方法矩阵短时傅里叶变换

一种基于通用计算机的通信协议信号加速处理方法

插件分布式并行计算训练分类器信号处理模块计算机

自适应量测噪声协方差的雷达共存目标跟踪方法

量测噪声跟踪方法变分贝叶斯算法雷达参数

下行MU-MIMO工作参数确定方法及装置

矩阵预训练模型多径时延参数

基于Mel语谱图特征及SSA-TFSCNet语音情感识别方法及系统

站点导航

APP 下载