摘要
本申请实施例公开了一种婴儿哭声检测方法、装置、电子设备及存储介质。该方法使用音频信号的幅度谱生成对数梅尔频谱特征,通过全卷积神经网络对婴儿哭声进行初步预测,并在此基础上分析哭声信号的时频特征,利用浊音谐波特性计算其幅度谱谱峰的均值,存入缓冲区并实时更新,再使用长度较短的滑动窗对缓冲区的谐波能量再求均值,从而避免遗漏较短哭声,且能够实现对初步预测结果进行二次验证。本申请实施例仅依靠小尺寸的神经网络做出初步预测,同时借助传统时频信号分析方法,对神经网络的预测结果做二次验证,有效地将深度方法和传统算法相结合,不仅神经网络的结构简单,运算分析也更高效,可以提升哭声检测的准确性,并且降低了误报率。
技术关键词
婴儿哭声检测方法
滑动窗口
音频
预测阈值
全卷积神经网络
样本
信号分析方法
短时傅里叶变换
电子设备
频谱特征
存储器
数据
处理器
谐波
可读存储介质
小尺寸
模块
定义
系统为您推荐了相关专利信息
时间序列预测方法
时间序列预测模型
大语言模型
时间序列预测系统
非暂态计算机可读存储介质
预警模型
时域卷积网络
系统故障预警方法
注意力机制
设备系统
姿态估计方法
多模型
人体关键点
采集人体姿态
高层次
分区
贝叶斯网络模型
滑动窗口
结构优化方法
框架房屋