摘要
本发明公开一种基于小波散射变换和Transformer编码器的鸟鸣声分类的方法。包括以下步骤:(1)采集相关的鸟鸣声样本。(2)进行预处理,对鸟鸣声信号进行降噪和标准化处理。(3)使用小波散射网络作为音频特征提取器提取多尺度多方向的特征。(4)构建基于小波散射变换和Transformer编码器,并设定小波散射变换的参数。(5)对音频数据集通过十折交叉验证划分为训练集和测试集。(6)对训练数据和测试数据进行散射变换得到散射系数,将结果作为音频分类的输入特征。(7)根据得到的类别概率分布和真实标签计算交叉熵损失,使用梯度下降法更新网络参数。(8)采用Transformer编码器对小波散射变换特征进行编码直接用全连接层对鸟鸣声进行分类。
技术关键词
编码器
Sinc函数
音频特征提取
更新网络参数
小波散射网络
变换特征
梯度下降法
多头注意力机制
小波滤波器
信号
样本
神经网络训练
数据
标签
多尺度
矩阵
低通滤波器
系统为您推荐了相关专利信息
恢复控制方法
类人机器人
多阶段
强化学习框架
关键帧
遥感图像语义分割
融合特征
影像
融合语义分割
分支
医学图像分割方法
编码器解码器
热点
高层语义特征
特征提取模块