语音合成模型训练方法以及语音合成方法

正文

推荐专利

语音合成模型训练方法以及语音合成方法

申请号：CN202410986607

申请日期：2024-07-22

公开号：CN118865943A

公开日期：2024-10-29

类型：发明专利

摘要

本公开关于语音合成模型训练方法以及语音合成方法，该语音合成模型训练方法包括获取样本文本以及所述样本文本对应的样本语音；将所述样本语音输入语音处理模型中的编码器进行语音编码，得到样本语音表征；将所述样本文本输入文本模型进行文本特征提取，得到样本文本表征，所述样本文本表征和所述样本语音表征具备相同长度；基于所述样本文本表征和所述样本语音表征训练初始模型，得到语音转换模型；基于所述文本模型、所述语音转换模型和所述语音处理模型中的解码器，得到语音合成模型；其中，所述文本模型和所述语音处理模型均为经过预训练的模型。本公开提升了语音合成模型的训练速度，降低了训练语音合成模型所需成本。

技术关键词

文本样本模型训练方法噪声预测语音编码解码器训练数据处理计算机程序产品编码特征模型训练装置编码器电子设备处理器可读存储介质数据获取模块线性

系统为您推荐了相关专利信息

一种基于合成数据生成的无监督深度学习方法

监督深度学习方法原始图像数据深度神经网络模型图像数据生成器样本

基于概率随机森林的工业过程未知故障诊断方法

随机森林故障诊断方法故障分类器样本节点

一种基于不平衡部分特征传输的无监督多模态腹部图像分割方法及系统

编码器模块图像分割方法多模态无监督训练样本图像

一种基于图像的轻量化车辆识别方法

车辆识别方法深度学习模型图像全局平均池化数据标签

医学超声领域知识库构建方法、相关设备及程序产品

医学超声实体知识库构建方法注意力文本

语音合成模型训练方法以及语音合成方法

站点导航

APP 下载