摘要
本申请属于声音监测领域,尤其是一种基于深度学习与时频特征的宠物叫声时间点定位方法,其包括以下步骤:分别采集宠物的正常叫声与异常叫声,进行特征提取,完成训练集构建;进行模型构建;输入模型进行预测得到候选叫声区间;初步识别结果包括粗定位叫声片段的起止时间和叫声类别;计算各频域数据块主峰强度与主峰频率范围,基于背景正态性自适应二值化计算出精确的叫声开始/结束时间点,完成异常叫声起止时间点的定位。本发明通过二次定位的方式,显著提升叫声时间点的识别精度,降低噪声对定位的干扰,基于背景正态性自适应二值化代替人为经验设定阈值的步骤,避免了人为经验对叫声与非叫声区域划分的影响。
技术关键词
点定位方法
信噪比
采样点
切片
音频
功率谱特征
频率
训练集
二值化阈值
信号
序列
深度神经网络
类间方差
噪声数据
生理
标签
位点
对比度