摘要
本发明提供了一种野外鸣声记录分类方法、介质及系统,属于鸣声识别技术领域,包括:利用声音采集装置获取基础音频,经过预处理和快速傅里叶变换得到时频数据。采用滑动窗口进行时频数据聚类,形成近似时频数据,并提取其时频特征。将特征输入预训练的野外鸣声分类模型,得到每个时间窗口的动物鸣声类别概率分布。基于概率分布合并连续时间窗口,形成初步的鸣声片段。对存在时间重叠的片段进行置信度比对与分割处理,最终按动物类别对鸣声片段进行分类存储,可以有效解决多个动物同时鸣叫的复杂情况,确保每个鸣声片段都能够准确地代表一段完整的动物声音,解决了现有技术存在野外鸣声分类模型消耗资源大的技术问题。
技术关键词
时间滑动窗口
分类方法
声音采集装置
轻量级卷积神经网络
动物
可读存储介质
数据
音频
分类准确率
计算机
分类系统
基础
聚类
训练集
样本
有效性
程序
发声