摘要
本申请公开了一种情绪类别的确定方法、装置、设备、存储介质和产品。该方法包括:获取音频数据;提取音频数据的MFCC特征,以及拼音音节的第一特征;将音频数据转化为文本,并确定文本中每个字的语调嵌入特征,以及文本的字嵌入特征、位置嵌入特征和段嵌入特征;将MFCC特征、第一特征、语调嵌入特征、字嵌入特征、位置嵌入特征和段嵌入特征进行融合,得到第二特征;将第二特征输入至情绪识别模型中,根据情绪识别模型中预设特征和预设情绪类别的关系信息,确定与第二特征对应的目标情绪类别。融合了基于人耳听觉特性的语音特征、文本特征、语调特征和声调特征等多种特征,提高了确定音频数据的情绪类别的准确率。
技术关键词
嵌入特征
情绪识别模型
MFCC特征
音频
计算机程序指令
文本
样本
拼音
数据
人耳听觉特性
计算机程序产品
电子设备
关系
可读存储介质
处理器
语音特征
声道
信息更新
模块
系统为您推荐了相关专利信息
访问存储器
外部存储设备
嵌入式设备启动
数据
固件
风险评估报告
递归神经网络
物理
设备状态评估
数据
声音控制模块
方向盘套
音频输出模块
持续供电功能
压力感知功能
教学装置
洗手
主体支架
影像装置
语音识别控制装置