一种语音情绪识别方法、系统、设备和介质

正文

推荐专利

一种语音情绪识别方法、系统、设备和介质

申请号：CN202511011353

申请日期：2025-07-22

公开号：CN120636479A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种语音情绪识别方法、系统、设备和介质，其涉及语音识别技术领域。包括：获取音频数据，提取音频数据的音频情感特征；将音频数据转录为文本数据，提取文本数据的低层文本特征；分别对音频情感特征表示和低层文本特征进行高层特征提取，得到高层音频特征和高层文本特征；将高层音频特征和高层文本特征映射到同一维度后进行跨模态融合，得到音频‑文本融合特征；将高层音频特征、高层文本特征和音频‑文本融合特征进行拼接，得到多模态特征；对多模态特征中多个特征的权重进行加权融合，得到加权融合特征，及根据加权融合特征确定对应的情绪识别结果。本发明能够显著提升在存在噪声干扰的复杂环境下的情绪识别准确性。

技术关键词

语音情绪识别方法文本融合特征情感特征注意力机制音频特征提取梅尔频率倒谱系数音质特征跨模态多模态特征深度卷积神经网络韵律特征语音情绪识别系统识别模块长短期记忆网络双向变换器

系统为您推荐了相关专利信息

一种敏感请求检测方法、系统、介质和产品

请求检测方法检索策略融合方法多模态计算机程序产品

基于神经网络的企业创新能力评估及预测装置、方法

企业创新能力预测装置指标系统注意力机制雷达

信息定位及其模型训练方法、装置、设备、介质及产品

样本强化特征视觉特征语句视频

一种特殊事件下道路交通状态预测方法、装置及终端

道路交通状态交通系统交通流时空注意力机制融合特征

超特高压隔离开关运行状态的确定方法、装置及存储介质

特高压隔离开关图像特征向量更新模型参数开关运行状态场景

一种语音情绪识别方法、系统、设备和介质

站点导航

APP 下载