一种提升合成音频自然度以及降噪的方法

正文

推荐专利

一种提升合成音频自然度以及降噪的方法

申请号：CN202510003560

申请日期：2025-01-02

公开号：CN119785762B

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及一种提升合成音频自然度以及降噪的方法，包括以下步骤：步骤1，构建音素编码器，步骤2，构建方差适配器，步骤3，构建频谱降噪器，实现提升合成音频自然度以及降噪；该方案提出在音素编码器阶段，加入基于Transformer的双向编码器，能够利用较少的训练资源，完成语音合成模型的训练；本发明首次将具有选择性状态空间的线性时间序列建模用于语音合成任务，借助于小波分解在图像去噪领域的应用，将其引入语音合成网络，成功地减少了生成音频的噪声。

技术关键词

编码器音频适配器深度学习模型维基百科时间序列模型降噪器符号线性生成训练样本语音数据状态空间模型前馈神经网络文本处理器注意力机制计算机

系统为您推荐了相关专利信息

基于人工智能的货物装车管理方法

装车管理方法订单路径规划算法车辆行驶里程调度管理方法

多维度特征关联的农产品重购意愿弱监督分析方法及系统

标签训练集分析方法深度学习模型多标签文本分类器

一种球类运动机器人的控制方法及系统

环境图像数据运动图像数据羽毛球击球点非暂态计算机可读存储介质深度学习模型

一种基于AI的校园安全监控方法及系统

校园安全监控方法监测策略校园安全监控系统通信链路学生

基于对比学习的纤维复合材料缺陷类型与分布预测方法

纤维复合材料分布预测方法图像编码器闭环反馈机制缺陷分类器

一种提升合成音频自然度以及降噪的方法

站点导航

APP 下载