摘要
本发明提供了一种基于语音分析的双相障碍识别方法和系统,涉及语音识别技术领域,包括:基于WavLM模型对语音序列进行特征提取,得到帧级语音特征;通过长短期记忆网络对帧级语音特征捕获上下文信息;利用多个SE_Res2Blocks模块提取不同维度的情感信息,得到语音序列的多种表征并进行融合;通过卷积操作进一步提炼和提纯特征,得到聚合表征;输入到时频注意力模块,以获取与双相障碍心境状态检测相关的时间戳特征和频带特征;将时间戳特征和频带特征输入至全连接层并连接一个Softmax函数以构造标签分类器,从而完成情感分类。通过本发明能够有效提高基于语音的双相障碍识别系统的准确性。
技术关键词
双相障碍
识别方法
语音特征
长短期记忆网络
Softmax函数
模块
注意力
矩阵乘法运算
识别系统
分类器
语音识别技术
存储程序指令
序列
标签
提纯
频率
存储器
校准