摘要
本申请属于人工智能领域,涉及一种音频情感识别方法,包括:获取目标对象的原始音频数据;对原始音频数据进行预处理,得到预处理后的音频数据;采用预训练的自监督模型,对音频数据进行特征提取,得到音频数据的音频特征信息;对音频特征信息进行降维处理,得到音频数据的情感特征向量;基于情感特征向量,采用预设的情感分类模型,对音频数据进行情感分类,得到情感分类结果;根据情感分类结果,确定音频数据表征的情感类型。本申请还提供一种装置、设备及介质。此外,本申请还涉及区块链技术,原始音频数据可存储于区块链中。本申请可以提高音频情感识别的准确性。
技术关键词
音频特征信息
情感分类模型
情感识别方法
数据
计算机可读指令
采样率
情感识别装置
主成分分析方法
支持向量机模型
样本
可读存储介质
置信度阈值
对象
特征提取模块
区块链技术
标签
处理器
系统为您推荐了相关专利信息
眼科手术器械
深度学习网络模型
神经网络模型
自动化管理系统
图像
库存控制方法
预测误差
非易失性存储介质
双向神经网络
库存控制装置
样本
多级特征
故障诊断方法
多头注意力机制
联合损失函数