一种基于神经网络模型的多声音事件检测定位方法及装置

AITNT
正文
推荐专利
一种基于神经网络模型的多声音事件检测定位方法及装置
申请号:CN202510880793
申请日期:2025-06-27
公开号:CN120544597A
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及人工智能技术领域,特别涉及一种基于神经网络模型的多声音事件检测定位方法及装置。方法包括:创新设计时间‑频率多尺度残差卷积块,与Conformer模块和十字绣单元模块组成网络模型,多尺度提取特征、加强长序列建模及促进任务协同优化,提升性能与准确性;数据处理方面,预加重、分帧加窗提升特征质量,音频通道交换与频谱增强增加数据多样性,减少过拟合,采用SALSA‑Lite特征增强了特征表达;训练策略上,运用多元损失函数兼顾任务需求加速收敛,借助验证集灵活调整超参数。这使得本方法训练效率高、实际性能优,在未知数据上泛化能力强,能精准应对复杂多变的实际场景,有效克服传统方法的不足。
技术关键词
神经网络模型 检测定位方法 联合损失函数 音频 多声源 声音检测 检测定位设备 检测定位装置 数据 计算机可读指令 多尺度 特征提取模块 训练集 误差 人工智能技术 频率 采样模块 处理器 通道
系统为您推荐了相关专利信息
1
基于神经网络的租赁式洗碗机洗涤液配给方法及产品
洗涤液 配给方法 洗碗机 水质 生成提示信息
2
基于大模型应用的资金路由支付系统
资金 支付系统 数据输入模块 识别用户风险 画像模型
3
一种道路智能建造信息管理系统及方法
智能分析模块 信息管理系统 预警模块 数据采集模块 排水系统工程
4
一种智能协作系统
视频编码器 智能协作 音频编码器 WIFI芯片 编码盒
5
数据处理方法、装置、设备、介质及程序产品
小区 栅格 互联网系统 数据处理方法 生成训练样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号