语音合成方法和装置、电子设备及存储介质

正文

推荐专利

语音合成方法和装置、电子设备及存储介质

申请号：CN202510526884

申请日期：2025-04-24

公开号：CN120299448A

公开日期：2025-07-11

类型：发明专利

摘要

本申请实施例提供了一种语音合成方法和装置、电子设备及存储介质，属于语音合成技术领域，适用于金融科技和医疗领域。该方法包括：基于特征编码子模型，对语音韵律草图进行特征提取，得到韵律特征向量；基于韵律特征向量，对目标文本进行文本编码，得到文本向量；基于特征编码子模型，对文本向量及韵律特征向量进行向量拼接，得到拼接特征向量；基于韵律控制子模型及韵律特征向量，进行韵律轮廓预测，得到韵律特征优化向量；基于韵律控制子模型及韵律特征优化向量，对拼接特征向量进行韵律调节，得到目标特征向量；基于语音生成子模型，对目标特征向量进行音频生成。本申请实施例能够生成更加精准的特定情感或风格。

技术关键词

韵律特征文本韵律模式语义向量电子设备样本轮廓可读存储介质音频特征提取模块语音编码数据获取模块拼接模块模式识别编码模块处理器

语音合成方法和装置、电子设备及存储介质

站点导航

APP 下载