摘要
本发明涉及一种基于语音识别的情绪状态监测方法,属于语音识别技术领域,解决了现有情绪状态监测不准确的问题。包括:接收用户音频并转换为语音文本,计算语音文本中每个词的情绪权重;将用户音频的MFCC特征和语音文本的词嵌入向量传入多模态综合模型,输出语音文本中每个词的语音情绪值和情感状态值;根据每个词的情绪权重、语音情绪值和情感状态值,计算出用户音频的情绪综合值,当情绪综合值处于情绪状态预警范围时,发出预警信息。实现了语音情绪识别率和监测准确率的提高。
技术关键词
状态监测方法
音频
融合特征
文本
交叉注意力机制
多模态
模态综合模型
模块
监测准确率
词嵌入向量
语音识别技术
矩阵
参数
算法
数据