摘要
本公开关于语音合成模型训练方法以及语音合成方法,该语音合成模型训练方法包括获取样本文本以及所述样本文本对应的样本语音;将所述样本语音输入语音处理模型中的编码器进行语音编码,得到样本语音表征;将所述样本文本输入文本模型进行文本特征提取,得到样本文本表征,所述样本文本表征和所述样本语音表征具备相同长度;基于所述样本文本表征和所述样本语音表征训练初始模型,得到语音转换模型;基于所述文本模型、所述语音转换模型和所述语音处理模型中的解码器,得到语音合成模型;其中,所述文本模型和所述语音处理模型均为经过预训练的模型。本公开提升了语音合成模型的训练速度,降低了训练语音合成模型所需成本。
技术关键词
文本
样本
模型训练方法
噪声预测
语音编码
解码器
训练数据处理
计算机程序产品
编码特征
模型训练装置
编码器
电子设备
处理器
可读存储介质
数据获取模块
线性
系统为您推荐了相关专利信息
监督深度学习方法
原始图像数据
深度神经网络模型
图像数据生成器
样本
编码器模块
图像分割方法
多模态
无监督
训练样本图像
车辆识别方法
深度学习模型
图像
全局平均池化
数据标签