一种多说话人语音分离方法及相关装置

AITNT
正文
推荐专利
一种多说话人语音分离方法及相关装置
申请号:CN202411836396
申请日期:2024-12-13
公开号:CN119580759A
公开日期:2025-03-07
类型:发明专利
摘要
本申请公开了一种多说话人语音分离方法及相关装置,涉及语音处理技术领域,方法包括:获取由两麦阵列针对位于不同方位的第一说话人和第二说话人采集的多说话人语音信号;根据多说话人语音信号确定两个麦克风的相位差,并对多说话人语音信号进行针对第一区域的固定波束形成处理和针对第二区域的固定波束形成处理,第一区域为第一说话人所在的区域,第二区域为第二说话人所在的区域;根据相位差以及两个区域分别对应的波束形成信号确定两个不同方位说话人的语音时频掩膜;根据确定的语音时频掩膜从多说话人语音信号的任一通道的信号中分离出第一说话人的语音信号和第二说话人的语音信号。本申请公开的多说话人语音分离方法具有较好的分离效果。
技术关键词
掩膜 波束 非语音 信号获取模块 计算机可读指令 电子设备 麦克风阵列 通道 高斯混合模型 后置滤波 计算机存储介质 存储计算机程序 计算机程序产品 功率 处理器 存储器
系统为您推荐了相关专利信息
1
分布式新能源集中调控方法、装置、介质及计算机设备
负荷转供 分布式新能源 新能源电力设备 调控方法 功率控制
2
基于时频特征联合建模的语音增强方法及系统
短时傅里叶变换 语音 解码器 卷积特征 频率
3
基于多源临床数据融合的重症智能预警分析系统
预警分析系统 运动视频数据 风险评估模型 呼吸机 波形
4
一种基于监督分支和不确定性估计的半监督膀胱肿瘤医学图像分割方法
医学图像分割方法 分支 肿瘤 教师 学生
5
基于多智能体深度强化学习的干扰功率分配方法
干扰设备 多智能体深度强化学习 功率分配方法 功率分配策略 决策
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号