一种基于PSO-GBDT-LR模型的咳嗽声音识别方法

AITNT
正文
推荐专利
一种基于PSO-GBDT-LR模型的咳嗽声音识别方法
申请号:CN202510663428
申请日期:2025-05-22
公开号:CN120388587A
公开日期:2025-07-29
类型:发明专利
摘要
本发明公开一种基于PSO‑GBDT‑LR模型的咳嗽声音识别方法,属于信号识别技术领域。包括采集音频信号;使用Berouti谱减法对音频信号进行去噪,获得去噪后的音频信号;音频事件检测VAD,对音频出现声音的部分进行分割;对分割出的每个音频样本,提取7维时域特征;对分割出每个音频样本进行短时傅里叶变换STFT,从频谱中提取2维频域特征;将提取到的7维时域特征和提取到的2维频域特征组合,形成9维特征向量组合;将咳嗽音频样本的特征向量标记为1类,非咳嗽音频样本声音样本的特征向量记为0类等步骤。本发明解决了咳嗽声音识别过程中声音的噪声特征过多和异常特征的问题,不仅可以精确区分咳嗽与非咳嗽声音的特征,还有较强的泛化能力。
技术关键词
咳嗽声音识别方法 样本 短时傅里叶变换 时域特征 频域特征 sigmoid函数 咳嗽监测 信号识别技术 建立分类模型 音频采集设备 粒子群优化算法 粗略 噪声特征 定义 分配设备 麦克风 曲线
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号