摘要
本发明公开了一种低信噪比下基于三通道深度神经网络的鸟声目标识别方法,属于鸟声音频处理识别领域,包括:对鸟声音频信号分帧处理,对一帧信号计算三维度特征,包括分数阶MFCC特征、高阶累积量特征和MFCC熵特征;获取训练完成的三通道异构深度神经网络,其三通道为CNN卷积神经网络、LSTM长短期记忆神经网络、BiLSTM双向长短期记忆神经网络;网络权值利用带有目标类别标签的若干样本鸟声音频信号得到的三维度特征进行网络训练确定,超参数利用霸王龙捕食算法优化得到;将一帧信号的三维度特征分别输入该网络的三个通道,基于三通道输出特征得到该帧信号的鸟声音频分类结果。本发明能提高低信噪比环境中鸟声音频识别准确性。
技术关键词
深度神经网络
识别方法
超参数
三通道
高阶累积量
分数阶傅里叶变换
长短期记忆神经网络
双向长短期记忆
异构
音频
输出特征
信号
低信噪比环境
MFCC特征
拼接方式
滤波
系统为您推荐了相关专利信息
模式识别方法
数学形态学
道路数据提取
斑块
孔洞
人脸特征向量
人脸识别网络
识别方法
编码向量
粒子
问答模型
识别正确率
生成回复信息
问答方法
超参数
长短期记忆网络
预警方法
更新模型参数
特征值
数据