一种语音合成方法、装置、设备和存储介质

正文

推荐专利

一种语音合成方法、装置、设备和存储介质

申请号：CN202411635438

申请日期：2024-11-15

公开号：CN119785755A

公开日期：2025-04-08

类型：发明专利

摘要

本申请实施例提供了一种语音合成方法、装置、设备和存储介质，接收待合成语音的目标文本；将所述目标文本对应的目标音素序列输入语音合成模型，得到所述语音合成模型输出的所述目标文本对应的目标语音；所述语音合成模型采用后验编码器、旁路引导模块、训练录音以及训练文本训练得到；所述旁路引导模块用于生成引导信息；所述引导信息用于引导所述后验编码器，以使所述后验编码器提取所述训练录音对应的线性谱中的骨干语音信息，所述骨干语音信息用于对所述语音合成模型进行训练。本申请实施例有助于提升语音合成模型整体训练效果，有效解决了模型合成的目标语音发音不准确、音质波动的问题，目标语音的清晰度和自然度得以增强。

技术关键词

语音生成引导信息文本编码器旁路模块高斯分布模型线性解码器序列神经网络参数矩阵机器可读介质发音处理器电子设备时序存储器

一种语音合成方法、装置、设备和存储介质

站点导航

APP 下载