一种基于神经网络模型的多声音事件检测定位方法及装置

正文

推荐专利

申请号：CN202510880793

申请日期：2025-06-27

公开号：CN120544597A

公开日期：2025-08-26

类型：发明专利

摘要

本发明涉及人工智能技术领域，特别涉及一种基于神经网络模型的多声音事件检测定位方法及装置。方法包括：创新设计时间‑频率多尺度残差卷积块，与Conformer模块和十字绣单元模块组成网络模型，多尺度提取特征、加强长序列建模及促进任务协同优化，提升性能与准确性；数据处理方面，预加重、分帧加窗提升特征质量，音频通道交换与频谱增强增加数据多样性，减少过拟合，采用SALSA‑Lite特征增强了特征表达；训练策略上，运用多元损失函数兼顾任务需求加速收敛，借助验证集灵活调整超参数。这使得本方法训练效率高、实际性能优，在未知数据上泛化能力强，能精准应对复杂多变的实际场景，有效克服传统方法的不足。

技术关键词

神经网络模型检测定位方法联合损失函数音频多声源声音检测检测定位设备检测定位装置数据计算机可读指令多尺度特征提取模块训练集误差人工智能技术频率采样模块处理器通道

系统为您推荐了相关专利信息

基于神经网络的租赁式洗碗机洗涤液配给方法及产品

洗涤液配给方法洗碗机水质生成提示信息

基于大模型应用的资金路由支付系统

资金支付系统数据输入模块识别用户风险画像模型

一种道路智能建造信息管理系统及方法

智能分析模块信息管理系统预警模块数据采集模块排水系统工程

一种智能协作系统

视频编码器智能协作音频编码器 WIFI芯片编码盒

数据处理方法、装置、设备、介质及程序产品

小区栅格互联网系统数据处理方法生成训练样本

一种基于神经网络模型的多声音事件检测定位方法及装置

站点导航

APP 下载