基于自适应交叉注意力的多维语音情感识别方法及系统

正文

推荐专利

申请号：CN202510538768

申请日期：2025-04-27

公开号：CN120340464A

公开日期：2025-07-18

类型：发明专利

摘要

本申请是关于一种基于自适应交叉注意力的多维语音情感识别方法及系统，其中，方法包括：获取多条原始语音数据与对应标签，提取每条原始语音数据对应的频谱图图像和梅尔频率倒谱系数谱，并与对应标签相结合，得到训练数据集；构建基于自适应交叉注意力的多维语音情感识别模型；将训练数据集输入特征提取层提取声学特征，并通过特征融合层生成多维语音情感特征；将多维语音情感特征输入情绪分类器，并构建交叉熵损失函数训练基于自适应交叉注意力的多维语音情感识别模型。能够全面捕捉语音信号中的情感信息，提升模型对语音数据的理解能力，显著提高特征利用率。

技术关键词

语音情感识别模型梅尔频率倒谱系数语音情感识别方法声学特征情感特征训练语音模型交叉注意力机制语音情感识别系统编码器模块分类器标签图像模型训练模块数据获取模块

系统为您推荐了相关专利信息

基于改进非洲秃鹫的声音分类方法、装置、设备及存储介质

声音分类方法算法变异策略长短期记忆网络梅尔频率倒谱系数

一种远程诊断牵引车的动力系统故障的方法及系统

变速器齿轮梅尔频率倒谱系数牵引车故障预测模型 XGBoost算法

产品优化建议生成方法和装置、电子设备及存储介质

产品需求文档画像建议生成方法对象指标

地下工程施工机械活动跨模态深度识别系统、方法及设备

地下工程施工机械跨模态注意力机制特征提取模块深度识别方法

一种基于大语言模型的车载聚合场景交互方法

大语言模型交互方法文本搜索场景标识

基于自适应交叉注意力的多维语音情感识别方法及系统

站点导航

APP 下载