摘要
本发明公开了一种基于GAN的语音合成声码器方法,主要涉及语音信号处理的语音合成技术领域;包括步骤:S1、设计一个生成器,并进行训练,将梅尔频谱图转换为语音信号;S2、设计一个判别器,并进行训练,判别器与生成器联合训练;S3、将特征匹配损失用于训练生成器,并加入额外的损失;S4、制定生成器和鉴别器的对抗损失函数;本发明能够同时兼顾训练稳定性和梯度丢失的问题。
技术关键词
声码器
全卷积神经网络
残差模块
语音信号处理
短时傅里叶变换
波形
卷积模块
定义
周期
上采样
元素
线性
序列
参数
系统为您推荐了相关专利信息
干扰信号识别方法
轻量化神经网络
分类器
统计特征
残差模块
信号预处理模块
癫痫
节点特征
融合特征
多通道脑电信号