一种卷积循环神经网络的多声源检测与定位方法及系统

正文

推荐专利

申请号：CN202411369175

申请日期：2024-09-29

公开号：CN119335478B

公开日期：2025-09-09

类型：发明专利

摘要

本发明提出了一种卷积循环神经网络的多声源检测与定位方法及系统。本发明提取多声道音频的幅度与相位特征,使用嵌入层为每帧音频生成位置编码，将特征与位置编码共同输入神经网络，并在网络结构中使用卷积神经网络依据通道间特征，学习声源类别的区分和声源定位，卷积层间使用多组空洞空间金字塔池化从不同尺度提取特征，使用空间转换器网络保持卷积神经网络的平移不变性，使用基于注意力机制的门控循环单元学习上下文信息，依据先前帧的信息辅助预测当前帧的声源位置，使用全局平均池化处理获取全局特征，全局特征与位置编码组合输入并行的全连接层，输出声音事件预测结果和到达方向预测结果。本发明实现了多个声源同时发声的分别定位，对混响和低信噪比环境具有鲁棒性。

技术关键词

多声道卷积循环神经网络卷积模块定位方法序列空洞多声源门控循环单元相位特征加权损失函数注意力机制全局平均池化转换器网络优化音频特征估计算法编码

系统为您推荐了相关专利信息

一种基于毫米波雷达端到端凌空手写字母识别方法

手写字母识别方法轨迹特征雷达双层长短期记忆网络信号特征提取

一种分布式光伏电站优化调度方法

分布式光伏电站优化调度方法光伏发电功率预测优化调度模型优化调度策略

用于固定资产的税务数据处理方法及系统

资产展示模型税务数据处理方法凭证动态

一种基于深度学习的电动车电池寿命预测方法

电池寿命预测方法驾驶习惯数据引入注意力机制电池健康状态电池剩余使用寿命

一种电器产品的电气安全测试方法

电器产品时序绝缘电阻值测试方法序列

一种卷积循环神经网络的多声源检测与定位方法及系统

站点导航

APP 下载