摘要
本发明公开基于改进Inception块与SACGAN的海洋哺乳动物叫声数据增强方法,属于音频处理与生成技术领域。其方法对海洋哺乳动物叫声数据进行小波去噪处理提高音频质量;将经过降噪的叫声转换为梅尔谱图进行表示,形成数据集;设计叫声生成网络,在该网络中引入代表海洋哺乳动物种类的标签变量,引导生成器生成指定类型的数据,将改进的Inception块通过在同一层级内使用不同尺寸的卷积核来提取不同感受野下的特征。设计损失函数;使用WaveGlow作为声码器将生成的梅尔谱图重构回高质量音频信号;设计分类实验评估本文方法的有效性。本发明实现了海洋哺乳动物叫声数据增强,有效提高了分类模型的预测精度。
技术关键词
海洋哺乳动物叫声
样本
小波去噪
音频
生成器网络
GPU并行运算
数据分布
信号
高通滤波器
支路
注意力
变量
网络优化器
随机噪声
短时傅里叶变换
重构
系统为您推荐了相关专利信息
电力调度控制装置
控制设备
执行设备
调度控制方法
分解算法
识别模型构建方法
调制识别方法
粒子群优化算法
更新模型参数
可读存储介质
生成对抗网络
联合损失函数
机器学习模型
传播算法
参数