摘要
本发明涉及一种基于联合扰动一致性约束的半监督水下声音事件检测方法,包括:获取强标签音频数据、弱标签音频数据和无标签音频数据的对数梅尔频谱;对无标签音频数据的对数梅尔频谱进行弱增强和强增强处理,得到相应的增强频谱;构建深度学习网络模型,使用强标签音频数据和弱标签音频数据的频谱进行有监督训练;对无标签音频数据采用多支特征扰动与强扰动联合的半监督模型;最后通过计算联合损失函数来优化深度学习网络模型的训练过程;使用训练后的深度学习网络模型检测水下声音事件,输出音频数据的事件类别。本发明用于利用少量强注数据实现声音事件的有效检测,提升模型性能。
技术关键词
声音事件检测方法
深度学习网络模型
音频
构建深度学习网络
卷积模块
联合损失函数
残差模块
计算机可执行指令
频谱特征
时域掩蔽
更新模型参数
无标签数据
全局平均池化
模型预测值
可读存储介质
多尺度
计算机程序产品
计算机系统
系统为您推荐了相关专利信息
视频背景
离线
特征点
图像轮廓特征
生成视频图像
视频帧
管控系统
标记
音频
Word2Vec模型