一种基于GAN的语音合成声码器方法

正文

推荐专利

一种基于GAN的语音合成声码器方法

申请号：CN202410785515

申请日期：2024-06-18

公开号：CN118588055A

公开日期：2024-09-03

类型：发明专利

摘要

本发明公开了一种基于GAN的语音合成声码器方法，主要涉及语音信号处理的语音合成技术领域；包括步骤：S1、设计一个生成器，并进行训练，将梅尔频谱图转换为语音信号；S2、设计一个判别器，并进行训练，判别器与生成器联合训练；S3、将特征匹配损失用于训练生成器，并加入额外的损失；S4、制定生成器和鉴别器的对抗损失函数；本发明能够同时兼顾训练稳定性和梯度丢失的问题。

技术关键词

声码器全卷积神经网络残差模块语音信号处理短时傅里叶变换波形卷积模块定义周期上采样元素线性序列参数

系统为您推荐了相关专利信息

基于轻量化神经网络的干扰信号识别方法

干扰信号识别方法轻量化神经网络分类器统计特征残差模块

一种基于激光超声的电池荷电状态检测系统

干涉仪电池荷电状态激光超声待测电池通道

基于自适应时空注意力与动态融合网络的癫痫预测方法

信号预处理模块癫痫节点特征融合特征多通道脑电信号

音频超分模型训练、音频超分处理方法、装置和电子设备

音频波形短时傅里叶变换蒸馏包裹相位

一种融合电力词汇信息的多源嵌入命名实体识别方法

电网现场作业命名实体识别方法电力词典字符

一种基于GAN的语音合成声码器方法

站点导航

APP 下载