摘要
本发明提供了一种基于多维信息感知策略的语音情感识别方法和系统,涉及语音情感识别技术领域,包括:提取WavLM特征和MFCC特征;通过Transformer层、MDIP层、CDI层和卷积层构建出多维信息感知和跨维度交织模块;通过该多维信息感知和跨维度交织模块分别处理处理WavLM特征和MFCC特征获得第一特征图和第二特征图;将第一特征图和第二特征图输入至SENet中进行特征融合,通过全连接操作和批归一化操作输出融合特征;通过分类器对融合特征进行分类,以预测待识别语音的情感。本发明提出的多维信息感知和跨维度交织模块能够有效提升情感识别模型在多数据集、多情境下的准确性、鲁棒性与通用性。
技术关键词
语音情感识别方法
MFCC特征
融合特征
语音情感识别系统
语音情感识别技术
滑动窗口
注意力
梅尔频率倒谱系数
策略
情感识别模型
音频特征提取
多尺度感知
存储程序指令
分类器
模块
频域特征
输出特征
系统为您推荐了相关专利信息
动态场景感知
事件相机
脉冲
多头注意力机制
事件流数据
场景特征
大语言模型
机器人
指令
非暂态计算机可读存储介质
阴道镜
图像分类方法
宫颈
图像分类模型
融合特征
实时监测系统
在线监测模块
动态关联模型
多模态数据融合
数字孪生体