一种多说话人语音分离方法及相关装置

正文

推荐专利

一种多说话人语音分离方法及相关装置

申请号：CN202411836396

申请日期：2024-12-13

公开号：CN119580759A

公开日期：2025-03-07

类型：发明专利

摘要

本申请公开了一种多说话人语音分离方法及相关装置，涉及语音处理技术领域，方法包括：获取由两麦阵列针对位于不同方位的第一说话人和第二说话人采集的多说话人语音信号；根据多说话人语音信号确定两个麦克风的相位差，并对多说话人语音信号进行针对第一区域的固定波束形成处理和针对第二区域的固定波束形成处理，第一区域为第一说话人所在的区域，第二区域为第二说话人所在的区域；根据相位差以及两个区域分别对应的波束形成信号确定两个不同方位说话人的语音时频掩膜；根据确定的语音时频掩膜从多说话人语音信号的任一通道的信号中分离出第一说话人的语音信号和第二说话人的语音信号。本申请公开的多说话人语音分离方法具有较好的分离效果。

技术关键词

掩膜波束非语音信号获取模块计算机可读指令电子设备麦克风阵列通道高斯混合模型后置滤波计算机存储介质存储计算机程序计算机程序产品功率处理器存储器

系统为您推荐了相关专利信息

分布式新能源集中调控方法、装置、介质及计算机设备

负荷转供分布式新能源新能源电力设备调控方法功率控制

基于时频特征联合建模的语音增强方法及系统

短时傅里叶变换语音解码器卷积特征频率

基于多源临床数据融合的重症智能预警分析系统

预警分析系统运动视频数据风险评估模型呼吸机波形

一种基于监督分支和不确定性估计的半监督膀胱肿瘤医学图像分割方法

医学图像分割方法分支肿瘤教师学生

基于多智能体深度强化学习的干扰功率分配方法

干扰设备多智能体深度强化学习功率分配方法功率分配策略决策

一种多说话人语音分离方法及相关装置

站点导航

APP 下载