一种基于多维信息感知策略的语音情感识别方法和系统

正文

推荐专利

申请号：CN202510741490

申请日期：2025-06-05

公开号：CN120279950B

公开日期：2025-09-05

类型：发明专利

摘要

本发明提供了一种基于多维信息感知策略的语音情感识别方法和系统，涉及语音情感识别技术领域，包括：提取WavLM特征和MFCC特征；通过Transformer层、MDIP层、CDI层和卷积层构建出多维信息感知和跨维度交织模块；通过该多维信息感知和跨维度交织模块分别处理处理WavLM特征和MFCC特征获得第一特征图和第二特征图；将第一特征图和第二特征图输入至SENet中进行特征融合，通过全连接操作和批归一化操作输出融合特征；通过分类器对融合特征进行分类，以预测待识别语音的情感。本发明提出的多维信息感知和跨维度交织模块能够有效提升情感识别模型在多数据集、多情境下的准确性、鲁棒性与通用性。

技术关键词

语音情感识别方法 MFCC特征融合特征语音情感识别系统语音情感识别技术滑动窗口注意力梅尔频率倒谱系数策略情感识别模型音频特征提取多尺度感知存储程序指令分类器模块频域特征输出特征

系统为您推荐了相关专利信息

一种基于事件相机与脉冲神经网络的动态场景感知方法、系统、终端及介质

动态场景感知事件相机脉冲多头注意力机制事件流数据

一种基于连续状态分解的机器人动作生成方法及相关装置

场景特征大语言模型机器人指令非暂态计算机可读存储介质

基于小波变换多模态融合的宫颈图像分类方法及系统

阴道镜图像分类方法宫颈图像分类模型融合特征

多模态数据融合的输电线路数字孪生实时监测系统及方法

实时监测系统在线监测模块动态关联模型多模态数据融合数字孪生体

一种基于多视角图神经网络的区域更新预测方法及系统

矩阵多视角神经网络模型构建模式语义特征

一种基于多维信息感知策略的语音情感识别方法和系统

站点导航

APP 下载