一种基于GAN的语音合成声码器方法

AITNT
正文
推荐专利
一种基于GAN的语音合成声码器方法
申请号:CN202410785515
申请日期:2024-06-18
公开号:CN118588055A
公开日期:2024-09-03
类型:发明专利
摘要
本发明公开了一种基于GAN的语音合成声码器方法,主要涉及语音信号处理的语音合成技术领域;包括步骤:S1、设计一个生成器,并进行训练,将梅尔频谱图转换为语音信号;S2、设计一个判别器,并进行训练,判别器与生成器联合训练;S3、将特征匹配损失用于训练生成器,并加入额外的损失;S4、制定生成器和鉴别器的对抗损失函数;本发明能够同时兼顾训练稳定性和梯度丢失的问题。
技术关键词
声码器 全卷积神经网络 残差模块 语音信号处理 短时傅里叶变换 波形 卷积模块 定义 周期 上采样 元素 线性 序列 参数
系统为您推荐了相关专利信息
1
基于轻量化神经网络的干扰信号识别方法
干扰信号识别方法 轻量化神经网络 分类器 统计特征 残差模块
2
一种基于激光超声的电池荷电状态检测系统
干涉仪 电池荷电状态 激光超声 待测电池 通道
3
基于自适应时空注意力与动态融合网络的癫痫预测方法
信号预处理模块 癫痫 节点特征 融合特征 多通道脑电信号
4
音频超分模型训练、音频超分处理方法、装置和电子设备
音频 波形 短时傅里叶变换 蒸馏 包裹相位
5
一种融合电力词汇信息的多源嵌入命名实体识别方法
电网现场作业 命名实体识别方法 电力 词典 字符
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号