一种与阵列几何无关的语音分离方法、装置及系统

正文

推荐专利

申请号：CN202510593680

申请日期：2025-05-09

公开号：CN120452466A

公开日期：2025-08-08

类型：发明专利

摘要

本发明涉及语音信号处理技术领域，具体提供一种与阵列几何无关的语音分离方法、装置及系统。该方法适用于多种麦克风阵列结构，采用虚拟麦克风估计机制生成增强空间信息密度的虚拟通道信号，并结合频谱–时间特征与空间方向特征，通过空间字典学习与注意力融合模块提取多模态表示。所提特征进一步输入分层双路径建模网络，在时间轴与频率轴上分别建模全局依赖关系，从而实现多说话人语音的高精度分离。所述系统具备良好的阵列结构自适应性，能够适应通道数变化与阵列形状差异，在远程会议、语音识别前端、车载语音处理等场景中均具有良好应用价值。

技术关键词

麦克风阵列采集短时傅里叶变换空间特征提取麦克风阵列结构语音信号处理技术二维卷积神经网络会议系统终端语音信号提取双路径网络发言者字典融合特征注意力分层多通道

系统为您推荐了相关专利信息

一种具有物理可解释的滚动轴承振动数据智能生成方法及系统

滚动轴承智能生成方法多层感知器数据驱动模型神经网络模型

一种基于IMU的步态分割方法

加速度分割方法步态事件识别步态幅值

一种数据分析的轴承生产控制系统

强化学习算法分阶段训练方法控制系统深度学习技术数据处理模块

一种基于声场分析的轨道交通广播方法

轨道交通广播信号识别模型矩阵数据梅尔频率倒谱系数

基于欠采样和神经网络恢复的布里渊光时域反射测量方法

布里渊光时域反射测量方法长短记忆神经网络注意力机制脉冲光傅里叶变换处理

一种与阵列几何无关的语音分离方法、装置及系统

站点导航

APP 下载