一种自适应语音增强与分离方法及系统

AITNT
正文
推荐专利
一种自适应语音增强与分离方法及系统
申请号:CN202510477666
申请日期:2025-04-16
公开号:CN120340519A
公开日期:2025-07-18
类型:发明专利
摘要
本发明公开了一种自适应语音增强与分离方法及系统,首先利用毫米波信号确定说话人位置,并从特定位置处提取毫米波振动特征用以表达用户语音行为特征,随后将混合语音与毫米波振动特征输入设计的多模态深度学习网络以实现清晰的语音增强与分离。本发明无需提前确定说话人数量,为增强与分离任务提供了统一框架,支持任意说话人数量的自动语音增强或分离;同时,本发明利用公开音频数据集,设计了跨模态数据生成方法并构建了多模态数据集,该数据集用于深度增强与分离网络的预训练。本发明取得了优异的语音增强与分离性能,具有广泛应用前景。
技术关键词
条件生成对抗网络 音频特征 条件对抗生成网络 特征提取网络 身份 振动特征 信号 数据生成方法 深度学习网络 匈牙利算法 恒虚警率 特征提取模块 聚类 语音特征 时序 扬声器 数据模块
系统为您推荐了相关专利信息
1
基于多模态感知的车门智能交互方法及装置
智能驾驶系统 智能交互方法 指纹验证 身份验证 车门
2
一种基于音频特征的遥控器配对方法、系统及介质
遥控器配对方法 蓝牙广播包 音频特征 遥控器配对系统 电视盒
3
基于音频的视频描述的生成方法、装置、设备及介质
视觉特征 视频帧 数据 音频特征 场景
4
一种基于区域远程诊疗平台的诊断数据远程传输方法
诊疗平台 远程传输方法 数据终端 移动通信技术 身份验证
5
基于自回归类深度学习语音合成的可控输出方法及设备
语音 深度学习模型 文本规范化 bert模型 语义特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号