摘要
本申请涉及呼吸音识别领域,具体地公开了一种基于梅尔频谱图的呼吸音分类方法及系统,其利用具有新型网络结构的呼吸音分类模型来提升呼吸音分类的灵敏度与特异度。特别地,所述具有新型网络结构的呼吸音分类模型包括音频频谱图变换器网络、多尺度特征提取网络、时序特征提取网络和线性输出层网络,其中,所述多尺度特征提取网络和所述时序特征提取网络形成特征编解码架构对由所述音频频谱图变换器网络输出的呼吸音图谱特征进行全局特征与局部特征强化学习,据此来提升呼吸音分类的灵敏度与特异度。
技术关键词
识别呼吸音
分类方法
特征提取网络
多尺度特征提取
序列
融合类别信息
上采样
新型网络结构
预测类别
音频
标签
矩阵
编码向量
LSTM模型
变换器
重构
语义
Softmax函数