摘要
本发明公开一种基于PSO‑GBDT‑LR模型的咳嗽声音识别方法,属于信号识别技术领域。包括采集音频信号;使用Berouti谱减法对音频信号进行去噪,获得去噪后的音频信号;音频事件检测VAD,对音频出现声音的部分进行分割;对分割出的每个音频样本,提取7维时域特征;对分割出每个音频样本进行短时傅里叶变换STFT,从频谱中提取2维频域特征;将提取到的7维时域特征和提取到的2维频域特征组合,形成9维特征向量组合;将咳嗽音频样本的特征向量标记为1类,非咳嗽音频样本声音样本的特征向量记为0类等步骤。本发明解决了咳嗽声音识别过程中声音的噪声特征过多和异常特征的问题,不仅可以精确区分咳嗽与非咳嗽声音的特征,还有较强的泛化能力。
技术关键词
咳嗽声音识别方法
样本
短时傅里叶变换
时域特征
频域特征
sigmoid函数
咳嗽监测
信号识别技术
建立分类模型
音频采集设备
粒子群优化算法
粗略
噪声特征
定义
分配设备
麦克风
曲线