摘要
本发明提供一种基于音频摘要的鼾声阻塞部位分类方法,旨在解决现有鼾声分析中数据冗余和分类准确性的问题,为睡眠呼吸暂停综合征的诊断提供可靠的技术支持。通过五个核心模块实现从整夜音频数据中提取关键鼾声片段并进行阻塞部位识别:第一,对麦克风录制的整夜音频信号进行预加重和滑窗分帧等预处理以及生成梅尔频谱图。第二,基于预训练的openL3网络,该模块接收预处理生成的梅尔频谱图作为输入,通过多层卷积网络进行特征提取。第三,基于声学深度特征,通过无监督学习方法实现鼾声片段的聚类和重要性评估。第四,包括基于高斯混合模型的语音端点检测算法,提取非静音的鼾声片段。第五,采用在公开数据集MPSSC上预训练的深度学习网络实现鼾声阻塞部位的识别。
技术关键词
无监督学习方法
高斯混合模型
深度学习网络
多层卷积网络
短时傅里叶变换
语音端点检测算法
音频
睡眠呼吸暂停综合征
分类方法
鼾声分析
摘要
麦克风
深度神经网络
特征提取模块
声学特征
数据冗余
频谱特征
系统为您推荐了相关专利信息
动态预警方法
桥梁健康监测数据
GMM模型
高斯混合模型
桥梁挠度
智能标签
神经网络模型
特征融合网络
样本
期望最大化算法
噪声图像
图像聚类方法
文本编码器
高斯概率密度函数
语义
医疗设备
个性化语音
语音特征
隐马尔可夫模型
语音信号处理