一种自适应语音增强与分离方法及系统

正文

推荐专利

一种自适应语音增强与分离方法及系统

申请号：CN202510477666

申请日期：2025-04-16

公开号：CN120340519A

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开了一种自适应语音增强与分离方法及系统，首先利用毫米波信号确定说话人位置，并从特定位置处提取毫米波振动特征用以表达用户语音行为特征，随后将混合语音与毫米波振动特征输入设计的多模态深度学习网络以实现清晰的语音增强与分离。本发明无需提前确定说话人数量，为增强与分离任务提供了统一框架，支持任意说话人数量的自动语音增强或分离；同时，本发明利用公开音频数据集，设计了跨模态数据生成方法并构建了多模态数据集，该数据集用于深度增强与分离网络的预训练。本发明取得了优异的语音增强与分离性能，具有广泛应用前景。

技术关键词

条件生成对抗网络音频特征条件对抗生成网络特征提取网络身份振动特征信号数据生成方法深度学习网络匈牙利算法恒虚警率特征提取模块聚类语音特征时序扬声器数据模块

系统为您推荐了相关专利信息

一种基于RSA加密算法的安全通信方法及系统

加密算法接收方通信方法私钥发送方

一种银联支付终端用安全算法验证方法及系统

算法验证方法支付终端银行卡交易特征格式

一种研究生入学考试自命题试卷的分拣方法

试卷分拣方法标签机器视觉技术身份证

一种无人系统内生安全防护系统和方法

无人设备网络安全功能身份认证模块防护系统防护方法

多源熔池特征融合的增材制造表面形貌预测方法及系统

表面形貌数据可见光图像网格映射方法深度学习网络深度学习预测

一种自适应语音增强与分离方法及系统

站点导航

APP 下载