一种基于条件流匹配和声码器的语音增强方法和系统

正文

推荐专利

申请号：CN202510536941

申请日期：2025-04-27

公开号：CN120526784A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了一种基于条件流匹配和声码器的语音增强方法和系统，包括以下步骤：步骤S1：构建梅尔频谱提取模块，用于将输入的带噪语音转换为带噪梅尔频谱；步骤S2：构建条件流匹配降噪模块，用于对步骤S1获取带噪梅尔频谱进行处理输出增强后的梅尔频谱；步骤S3：构建神经网络声码器模块，用于将步骤S2获取的增强梅尔频谱还原为时域语音波形，从而得到增强后的语音信号。本发明首次提出结合条件流匹配和声码器的语音增强方法，并创新性地在梅尔频谱域引入条件流匹配方法，构建了一个端到端的语音增强系统，实现了从输入噪声语音到输出高质量语音信号的完整处理流程。

技术关键词

降噪模块流匹配方法声码器多层感知机层训练神经网络位置编码器随机噪声优化器解码器噪声语音波形上采样残差结构状态更新日志阶段多尺度

系统为您推荐了相关专利信息

基于渐进式学习及多模态融合的空间转录组数据聚类方法

图像特征信息数据聚类方法训练神经网络模型样本编码器

齿轮寿命评估用数据集构建方法、齿轮寿命评估方法和系统

数据集构建方法评估预测模型寿命评估方法齿轮组寿命特征

一种基于AI的软件项目进度排期与监督系统

监督系统项目长短期记忆网络时间序列特征资源分配

一种永磁同步电机无速度传感器的控制方法及系统

数学模型永磁 LSTM神经网络加速度坐标系

一种化工企业安全监管用安全风险分区管理方法及系统

分区管理方法风险预测模型安全监管信息熵熵权法

一种基于条件流匹配和声码器的语音增强方法和系统

站点导航

APP 下载