TTS系统、语音合成方法、装置、电子设备和存储介质

正文

推荐专利

申请号：CN202411675350

申请日期：2024-11-21

公开号：CN119516999A

公开日期：2025-02-25

类型：发明专利

摘要

本发明提供一种TTS系统、语音合成方法、装置、电子设备和存储介质。所述语音合成方法包括获取目标文本对应的音素序列；以及，提取基准语音的条件特征并将所述基准语音处理为离散化的编码表示，所述条件特征包括声学特征和/或语义特征；将所述音素序列、所述条件特征和所述编码表示输入预训练的语音合成模型，并获取所述语音合成模型输出的匹配于所述目标文本的目标语音；其中，所述语音合成模型包括神经编解码语言模型及其连接的音频解码器，所述神经编解码语言模型包含自回归模块且不包含非自回归模块。

技术关键词

语音编解码音频解码器样本声码器 TTS系统声学特征基准文本语义特征序列模块矢量量化算法电子设备处理器发音指令高层次输入端可读存储介质

TTS系统、语音合成方法、装置、电子设备和存储介质

站点导航

APP 下载