摘要
本发明公开了音频情感分类方法、装置、计算机设备及存储介质,涉及数据处理技术领域及金融科技领域,其中,通过获取待情感分类的目标音频数据;对所述目标音频数据进行特征提取,得到MFCC特征;计算所述MFCC特征的一阶导数和二阶导数,并将所述一阶导数和所述二阶导数与所述MFCC特征进行拼接,得到3D MFCC特征;基于所述3D MFCC特征,通过音频情感分类模型对所述目标音频数据进行情感分类。本发明通过先处理得到目标音频数据的3D MFCC特征,再通过音频情感分类模型对于3D MFCC特征的处理而实现对目标音频数据的情感分类,从而本发明可在保证音频情感分类准确性的同时,还可降低计算成本、提高处理效率。
技术关键词
情感分类方法
MFCC特征
情感分类模型
音频
短时傅里叶变换
深度学习模型
计算机设备
离散余弦变换
可读存储介质
特征提取模块
数据处理技术
数据获取模块
处理器
分类装置
残差网络
拼接模块
功率
存储器