一种基于多层神经网络的多声音事件检测方法

AITNT
正文
推荐专利
一种基于多层神经网络的多声音事件检测方法
申请号:CN202411588305
申请日期:2024-11-07
公开号:CN119446180A
公开日期:2025-02-14
类型:发明专利
摘要
一种基于多层神经网络的多声音事件检测方法,涉及声音事件检测领域。本发明提出基于融合经验模态分解算法、胶囊网络,注意力机制和双向门控循环网络的弱标记多声音事件检测模型。在该模型中,首先使用AMM‑EMD算法进行预处理,丰富声音事件特征信息,并引入并行卷积结构提取高级特征信息;再利用胶囊网络强大的泛化能力和注意力机制捕捉全局依赖性的能力,对高级特征进一步处理;同时,利用BiGRU模块获取上下文信息。本发明提出的模型在不同的数据集上进行对比消融实验,利用F1和ER评价声音事件检测效果,本发明提出的模型均比其他基线模型有所改善,F1和ER均有提高。
技术关键词
声音事件检测方法 事件检测模型 融合经验模态分解 多头注意力机制 胶囊网络 声音信号特征 门控循环网络 EMD算法 事件特征 解码器 编码器 模块 网络结构 频率 基础
系统为您推荐了相关专利信息
1
海量单细胞数据的自监督聚类方法
Louvain算法 聚类方法 矩阵 基因表达数据 高斯核函数
2
融合行业知识库的多模态推理链生成方法
煤矿现场 数据 生成场景 上下文特征 融合语义
3
一种基于心率变异性特征和并行神经网络的抑郁状态评估方法及装置
代表 抑郁 并行神经网络 云端服务器 状态评估方法
4
基于有监督微调的体检报告解读方法、系统、设备及介质
归一化模块 多头注意力机制 报告 解读方法 个性化特征
5
基于CSI的解耦与结构化建模的人体动作识别方法
人体动作识别方法 样本 重构 胶囊网络 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号