摘要
本申请实施例提供了一种基于语音的情绪识别方法和装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技领域和医疗科技领域。该方法包括:获取目标语音识别模型;目标语音识别模型包括目标音频编码子模型、目标音频解码子模型、目标说话人识别子模型;对目标语音数据进行特征提取,得到目标语音特征;通过目标音频编码子模型对目标语音特征进行音频编码,得到目标音频编码数据;通过目标音频解码子模型对目标音频编码数据进行文本解析,得到目标语音文本信息;通过目标说话人识别子模型对情绪性别编码嵌入、目标音频编码数据和目标语音文本信息进行双重交叉注意力计算,得到目标说话人情绪信息,能够提高语音情绪识别的准确性。
技术关键词
说话人识别
音频编码
语音识别模型
音频解码
语音特征
注意力
文本
样本
情绪识别方法
嵌入特征
数据
标签
语音情绪识别
情绪识别装置
电子设备
可读存储介质
人工智能技术
系统为您推荐了相关专利信息
识别语音信号
低功耗嵌入式设备
样本
语音识别方法
语音特征
编码特征
生成语音信号
识别语音信号
注意力机制
多层感知机层
文本内容特征
语音推荐方法
语音特征
说话人识别
模型训练方法
音乐推荐方法
音乐推荐模型
情感分析模型
情绪特征
心理
多模态语音
课堂场景
音频
自动语音识别系统
视频