一种自适应语音增强与分离方法及系统

AITNT
正文
推荐专利
一种自适应语音增强与分离方法及系统
申请号:CN202510477666
申请日期:2025-04-16
公开号:CN120340519A
公开日期:2025-07-18
类型:发明专利
摘要
本发明公开了一种自适应语音增强与分离方法及系统,首先利用毫米波信号确定说话人位置,并从特定位置处提取毫米波振动特征用以表达用户语音行为特征,随后将混合语音与毫米波振动特征输入设计的多模态深度学习网络以实现清晰的语音增强与分离。本发明无需提前确定说话人数量,为增强与分离任务提供了统一框架,支持任意说话人数量的自动语音增强或分离;同时,本发明利用公开音频数据集,设计了跨模态数据生成方法并构建了多模态数据集,该数据集用于深度增强与分离网络的预训练。本发明取得了优异的语音增强与分离性能,具有广泛应用前景。
技术关键词
条件生成对抗网络 音频特征 条件对抗生成网络 特征提取网络 身份 振动特征 信号 数据生成方法 深度学习网络 匈牙利算法 恒虚警率 特征提取模块 聚类 语音特征 时序 扬声器 数据模块
系统为您推荐了相关专利信息
1
一种基于RSA加密算法的安全通信方法及系统
加密算法 接收方 通信方法 私钥 发送方
2
一种银联支付终端用安全算法验证方法及系统
算法验证方法 支付终端 银行卡 交易特征 格式
3
一种研究生入学考试自命题试卷的分拣方法
试卷 分拣方法 标签 机器视觉技术 身份证
4
一种无人系统内生安全防护系统和方法
无人设备 网络安全功能 身份认证模块 防护系统 防护方法
5
多源熔池特征融合的增材制造表面形貌预测方法及系统
表面形貌数据 可见光图像 网格映射方法 深度学习网络 深度学习预测
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号