一种基于多维信息感知策略的语音情感识别方法和系统

AITNT
正文
推荐专利
一种基于多维信息感知策略的语音情感识别方法和系统
申请号:CN202510741490
申请日期:2025-06-05
公开号:CN120279950B
公开日期:2025-09-05
类型:发明专利
摘要
本发明提供了一种基于多维信息感知策略的语音情感识别方法和系统,涉及语音情感识别技术领域,包括:提取WavLM特征和MFCC特征;通过Transformer层、MDIP层、CDI层和卷积层构建出多维信息感知和跨维度交织模块;通过该多维信息感知和跨维度交织模块分别处理处理WavLM特征和MFCC特征获得第一特征图和第二特征图;将第一特征图和第二特征图输入至SENet中进行特征融合,通过全连接操作和批归一化操作输出融合特征;通过分类器对融合特征进行分类,以预测待识别语音的情感。本发明提出的多维信息感知和跨维度交织模块能够有效提升情感识别模型在多数据集、多情境下的准确性、鲁棒性与通用性。
技术关键词
语音情感识别方法 MFCC特征 融合特征 语音情感识别系统 语音情感识别技术 滑动窗口 注意力 梅尔频率倒谱系数 策略 情感识别模型 音频特征提取 多尺度感知 存储程序指令 分类器 模块 频域特征 输出特征
系统为您推荐了相关专利信息
1
一种基于事件相机与脉冲神经网络的动态场景感知方法、系统、终端及介质
动态场景感知 事件相机 脉冲 多头注意力机制 事件流数据
2
一种基于连续状态分解的机器人动作生成方法及相关装置
场景特征 大语言模型 机器人 指令 非暂态计算机可读存储介质
3
基于小波变换多模态融合的宫颈图像分类方法及系统
阴道镜 图像分类方法 宫颈 图像分类模型 融合特征
4
多模态数据融合的输电线路数字孪生实时监测系统及方法
实时监测系统 在线监测模块 动态关联模型 多模态数据融合 数字孪生体
5
一种基于多视角图神经网络的区域更新预测方法及系统
矩阵 多视角 神经网络模型构建 模式 语义特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号