一种基于深度学习与时频特征的宠物叫声时间点定位方法

正文

推荐专利

申请号：CN202510380186

申请日期：2025-03-28

公开号：CN120260586A

公开日期：2025-07-04

类型：发明专利

摘要

本申请属于声音监测领域，尤其是一种基于深度学习与时频特征的宠物叫声时间点定位方法，其包括以下步骤：分别采集宠物的正常叫声与异常叫声，进行特征提取，完成训练集构建；进行模型构建；输入模型进行预测得到候选叫声区间；初步识别结果包括粗定位叫声片段的起止时间和叫声类别；计算各频域数据块主峰强度与主峰频率范围，基于背景正态性自适应二值化计算出精确的叫声开始/结束时间点，完成异常叫声起止时间点的定位。本发明通过二次定位的方式，显著提升叫声时间点的识别精度，降低噪声对定位的干扰，基于背景正态性自适应二值化代替人为经验设定阈值的步骤，避免了人为经验对叫声与非叫声区域划分的影响。

技术关键词

点定位方法信噪比采样点切片音频功率谱特征频率训练集二值化阈值信号序列深度神经网络类间方差噪声数据生理标签位点对比度

一种基于深度学习与时频特征的宠物叫声时间点定位方法

站点导航

APP 下载