摘要
本发明公开了一种基于语音识别的情绪识别方法,属于语音处理技术领域。本发明设置3种不同长度的观察窗口在待识别的语音信号上滑动,以获取3种发音段集合。在发音段集合中计算每个时刻的发音能量值,构建发音能量向量。根据发音能量向量与日常平均发音能量值的比值,计算发音能量强度值,形成发音强度权值向量。提取每个时刻的发音谱频持续值,构建发音谱频权值向量。采用双通道特征增强模块对发音能量向量进行特征提取,并结合发音谱频权值向量和发音强度权值向量进行特征增强,最终得到语音情绪特征。最后,利用分类器对3种语音情绪特征进行分类处理,以识别情绪类型。本方法通过多维特征提取和增强,显著提高了情绪识别的准确性。
技术关键词
发音
情绪识别方法
识别语音信号
情绪特征
特征值
输入端
注意力
分类器
通道
识别人
频率
强度
BP神经网络
输出端
模块
表达式
识别情绪
加法器
断点
系统为您推荐了相关专利信息
设备状态参数
工业大数据平台
时序
数据治理方法
多模态
银行金融机构
数据分类
逻辑回归算法
金融科技技术
随机森林