摘要
本发明公开了一种基于条件流匹配和声码器的语音增强方法和系统,包括以下步骤:步骤S1:构建梅尔频谱提取模块,用于将输入的带噪语音转换为带噪梅尔频谱;步骤S2:构建条件流匹配降噪模块,用于对步骤S1获取带噪梅尔频谱进行处理输出增强后的梅尔频谱;步骤S3:构建神经网络声码器模块,用于将步骤S2获取的增强梅尔频谱还原为时域语音波形,从而得到增强后的语音信号。本发明首次提出结合条件流匹配和声码器的语音增强方法,并创新性地在梅尔频谱域引入条件流匹配方法,构建了一个端到端的语音增强系统,实现了从输入噪声语音到输出高质量语音信号的完整处理流程。
技术关键词
降噪模块
流匹配方法
声码器
多层感知机层
训练神经网络
位置编码器
随机噪声
优化器
解码器
噪声语音
波形
上采样
残差结构
状态更新
日志
阶段
多尺度
系统为您推荐了相关专利信息
图像特征信息
数据聚类方法
训练神经网络模型
样本
编码器
数据集构建方法
评估预测模型
寿命评估方法
齿轮组
寿命特征
监督系统
项目
长短期记忆网络
时间序列特征
资源分配
分区管理方法
风险预测模型
安全监管
信息熵
熵权法