基于MFAN的语音情感识别模型及其构建方法

正文

推荐专利

申请号：CN202410702210

申请日期：2024-06-01

公开号：CN118538248A

公开日期：2024-08-23

类型：发明专利

摘要

本发明涉及一种基于MFAN的语音情感识别模型及其构建方法，该方法包括：对输入音频进行特征工程并从中得到处理后的音频和log‑mel频谱图；将log‑mel频谱图输入到话语级特征提取模块中，使用卷积块扩大模型感受野以更好提取话语级情感特征；将音频输入到多尺度特征提取模块中使用多尺度注意力机制提取不同尺度的情感特征；将两个模块提取到的不同粒度的特征进行融合，得到具有竞争力的情感特征；将情感特征输入到全连接层中从而得到最终的情感识别结果。通过本发明可以用于解决语音情感识别任务时存在局限性的问题，为以后情感识别任务获得更好的识别效果探索了新的思路。

技术关键词

语音情感识别模型特征提取模块情感特征多尺度注意力机制多尺度特征提取音频特征工程输入多尺度信号滤波器视野代表分辨率频率序列网络

系统为您推荐了相关专利信息

一种SPECT-MPI图像分类方法及系统

负荷特征注意力图像分类方法样本三维残差网络

基于局部-全局时间关系的微表情识别方法、装置及介质

局部空间特征表情识别方法关系网络特征提取模块光流方法

基于视频监控的矿山运输安全自适应优化系统及方法

特征提取单元预警模型曲线矿山传感器

基于护理信息的慢性阻塞性肺病风险评估系统

慢性阻塞性肺病风险预测模型风险评估系统特征提取模块多层次特征融合

基于可穿戴设备的睡眠质量检测方法、设备及存储介质

睡眠特征可穿戴设备时序特征睡眠阶段分类序列

基于MFAN的语音情感识别模型及其构建方法

站点导航

APP 下载