一种基于VQ-MAE网络的抹香鲸叫声增强方法

正文

推荐专利

申请号：CN202510161783

申请日期：2025-02-14

公开号：CN119649837B

公开日期：2025-04-18

类型：发明专利

摘要

本发明涉及音频信号处理领域，具体的涉及一种基于VQ‑MAE网络的抹香鲸叫声增强方法，包括：步骤1：对抹香鲸叫声音频信号进行噪声降低处理，调整音频信号的振幅范围；步骤2：处理频谱图像，将提取后的特征向量作为MAE网络输入的一部分；步骤3：通过LSTM网络对音频信号进行处理，提取原始的音频信号的时序特征；步骤4：设计并训练一个多模态掩码编码器MAE网络，训练不同模态的融合权重；步骤5：进行掩码，选取掩码效果最好的策略训练网络进行数据增强。本发明创新性的引入了多模态网络融合声音信号的时域、频域以及空间域特征，更为精确且深入地捕捉与增强抹香鲸叫声中的语义细节，为叫声的分类和识别提供了强有力的支持。

技术关键词

掩码策略编码器网络图像时序特征解码器 GAN模型令牌梅尔频率倒谱系数音频信号分解像素高维向量空间模态特征滤波器多模态采样点音频信号处理

系统为您推荐了相关专利信息

基于用户行为预测的中央空调智能控制方法及系统

深度确定性策略梯度流动监测装置算法模型送风口调节装置风机转速

投资产品推荐方法、装置、电子设备及存储介质

产品特征信息风险评估值投资产品推荐方法时间段对象

基于时空图网络的有源配电网故障定位与识别方法及系统

故障诊断模型对抗性数据迁移学习策略有源配电网

一种预测电能表软件平均失效时间的方法和计算机设备

预测电能表软件可靠性评估时间段启发式算法神经网络模型

跨模态铁路数据的检索方法、装置、设备和存储介质

铁路检索方法文本特征向量跨模态上下文特征

一种基于VQ-MAE网络的抹香鲸叫声增强方法

站点导航

APP 下载