一种基于条件流匹配和声码器的语音增强方法和系统

AITNT
正文
推荐专利
一种基于条件流匹配和声码器的语音增强方法和系统
申请号:CN202510536941
申请日期:2025-04-27
公开号:CN120526784A
公开日期:2025-08-22
类型:发明专利
摘要
本发明公开了一种基于条件流匹配和声码器的语音增强方法和系统,包括以下步骤:步骤S1:构建梅尔频谱提取模块,用于将输入的带噪语音转换为带噪梅尔频谱;步骤S2:构建条件流匹配降噪模块,用于对步骤S1获取带噪梅尔频谱进行处理输出增强后的梅尔频谱;步骤S3:构建神经网络声码器模块,用于将步骤S2获取的增强梅尔频谱还原为时域语音波形,从而得到增强后的语音信号。本发明首次提出结合条件流匹配和声码器的语音增强方法,并创新性地在梅尔频谱域引入条件流匹配方法,构建了一个端到端的语音增强系统,实现了从输入噪声语音到输出高质量语音信号的完整处理流程。
技术关键词
降噪模块 流匹配方法 声码器 多层感知机层 训练神经网络 位置编码器 随机噪声 优化器 解码器 噪声语音 波形 上采样 残差结构 状态更新 日志 阶段 多尺度
系统为您推荐了相关专利信息
1
基于渐进式学习及多模态融合的空间转录组数据聚类方法
图像特征信息 数据聚类方法 训练神经网络模型 样本 编码器
2
齿轮寿命评估用数据集构建方法、齿轮寿命评估方法和系统
数据集构建方法 评估预测模型 寿命评估方法 齿轮组 寿命特征
3
一种基于AI的软件项目进度排期与监督系统
监督系统 项目 长短期记忆网络 时间序列特征 资源分配
4
一种永磁同步电机无速度传感器的控制方法及系统
数学模型 永磁 LSTM神经网络 加速度 坐标系
5
一种化工企业安全监管用安全风险分区管理方法及系统
分区管理方法 风险预测模型 安全监管 信息熵 熵权法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号