一种基于PSO-GBDT-LR模型的咳嗽声音识别方法

正文

推荐专利

申请号：CN202510663428

申请日期：2025-05-22

公开号：CN120388587A

公开日期：2025-07-29

类型：发明专利

摘要

本发明公开一种基于PSO‑GBDT‑LR模型的咳嗽声音识别方法，属于信号识别技术领域。包括采集音频信号；使用Berouti谱减法对音频信号进行去噪，获得去噪后的音频信号；音频事件检测VAD，对音频出现声音的部分进行分割；对分割出的每个音频样本，提取7维时域特征；对分割出每个音频样本进行短时傅里叶变换STFT，从频谱中提取2维频域特征；将提取到的7维时域特征和提取到的2维频域特征组合，形成9维特征向量组合；将咳嗽音频样本的特征向量标记为1类，非咳嗽音频样本声音样本的特征向量记为0类等步骤。本发明解决了咳嗽声音识别过程中声音的噪声特征过多和异常特征的问题，不仅可以精确区分咳嗽与非咳嗽声音的特征，还有较强的泛化能力。

技术关键词

咳嗽声音识别方法样本短时傅里叶变换时域特征频域特征 sigmoid函数咳嗽监测信号识别技术建立分类模型音频采集设备粒子群优化算法粗略噪声特征定义分配设备麦克风曲线

一种基于PSO-GBDT-LR模型的咳嗽声音识别方法

站点导航

APP 下载