一种基于联合扰动一致性约束的半监督水下声音事件检测方法

AITNT
正文
推荐专利
一种基于联合扰动一致性约束的半监督水下声音事件检测方法
申请号:CN202411894466
申请日期:2024-12-20
公开号:CN119673210B
公开日期:2025-10-21
类型:发明专利
摘要
本发明涉及一种基于联合扰动一致性约束的半监督水下声音事件检测方法,包括:获取强标签音频数据、弱标签音频数据和无标签音频数据的对数梅尔频谱;对无标签音频数据的对数梅尔频谱进行弱增强和强增强处理,得到相应的增强频谱;构建深度学习网络模型,使用强标签音频数据和弱标签音频数据的频谱进行有监督训练;对无标签音频数据采用多支特征扰动与强扰动联合的半监督模型;最后通过计算联合损失函数来优化深度学习网络模型的训练过程;使用训练后的深度学习网络模型检测水下声音事件,输出音频数据的事件类别。本发明用于利用少量强注数据实现声音事件的有效检测,提升模型性能。
技术关键词
声音事件检测方法 深度学习网络模型 音频 构建深度学习网络 卷积模块 联合损失函数 残差模块 计算机可执行指令 频谱特征 时域掩蔽 更新模型参数 无标签数据 全局平均池化 模型预测值 可读存储介质 多尺度 计算机程序产品 计算机系统
系统为您推荐了相关专利信息
1
一种消除音频设备开关机冲击声电路
冲击声 音频设备 开关机 三极管 音频功放芯片
2
离线视频背景处理方法、系统及可读存储介质
视频背景 离线 特征点 图像轮廓特征 生成视频图像
3
一种多媒体数据处理方法、装置、电子设备、芯片及介质
多媒体 脚本 云端 终端 收发模块
4
适用于复杂环境下的音频数据增强方法及系统
序列 语音 音频数据处理技术 频段 噪声
5
一种基于神经网络的内容安全AI边缘管控系统及方法
视频帧 管控系统 标记 音频 Word2Vec模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号