语音合成方法、装置和电子设备

正文

推荐专利

语音合成方法、装置和电子设备

申请号：CN202510627584

申请日期：2025-05-15

公开号：CN120708591A

公开日期：2025-09-26

类型：发明专利

摘要

本申请公开了一种语音合成方法、装置和电子设备，属于语音合成技术领域。所述方法包括：获取自然语言表达的待处理文本；将待处理文本分别输入至已训练的韵律提取模型和情感分类模型，获得韵律提取模型对待处理文本进行韵律提取后输出的目标韵律信息，以及情感分类模型对待处理文本进行情感类别提取后输出的情感类别分布；将待处理文本、目标韵律信息以及情感类别分布输入至已训练的语音合成模型，获得语音合成模型输出的目标语音波形；其中，目标韵律信息包括为待处理文本中的每个文本单元预测的韵律类别；情感类别分布包括待处理文本在各个情感类别下的预测概率，提高了生成语音的自然性和流畅性，以及实现合成语音的多样化情感表达。

技术关键词

情感类别情感分类模型文本编码器模块语音序列解码器样本变量韵律特征融合特征自然语言情感特征多头注意力机制波形采样器标签电子设备

语音合成方法、装置和电子设备

站点导航

APP 下载