语音合成模型训练、语音合成方法及装置

正文

推荐专利

语音合成模型训练、语音合成方法及装置

申请号：CN202510524066

申请日期：2025-04-24

公开号：CN120412531A

公开日期：2025-08-01

类型：发明专利

摘要

本发明提供一种语音合成模型训练、语音合成方法及装置，所述训练方法包括：获取样本文本的原始频谱图；基于初始合成模型，应用样本文本的语义信息，对原始频谱图进行降维映射，得到特征向量，并对特征向量进行上采样后，基于上采样后的特征向量合成得到样本语音，特征向量包括原始频谱图的关键信息，且特征向量的维度小于原始频谱图的维度；基于样本语音对应频谱图与原始频谱图之间的差异，对初始合成模型进行参数迭代，得到语音合成模型。本发明避免了传统语音合成模型训练过程中对中间态频谱图的显式生成，从而规避了由此产生的误差累积问题，提升了最终合成语音的质量。

技术关键词

模型训练方法语音样本文本上采样参数语义非暂态计算机可读存储介质随机噪声模型训练装置处理器计算机程序产品统计特征存储器电子设备标签误差

语音合成模型训练、语音合成方法及装置

站点导航

APP 下载