基于韵律边界信息和VAE结构的语音合成模型生成方法

正文

推荐专利

申请号：CN202411037244

申请日期：2024-07-31

公开号：CN119107931B

公开日期：2025-07-22

类型：发明专利

摘要

本申请涉及一种基于韵律边界信息和VAE结构的语音合成模型生成方法。所述方法包括：获取训练数据集；训练数据集包括样本语音以及样本语音对应的韵律边界信息、文本信息和音素信息；根据样本语音以及对应的音素信息，训练语音合成网络，得到训练后的语音合成网络；根据样本语音以及对应的韵律边界信息，训练韵律编码网络，得到训练后的韵律编码网络；根据样本语音以及对应的文本信息、音素信息和韵律边界信息，训练韵律预测网络，得到训练后的韵律预测网络；根据训练后的语音合成网络、训练后的韵律编码网络和训练后的韵律预测网络，生成基于韵律边界信息和VAE结构的语音合成模型。采用本方法能够生成具有准确韵律的合成语音，提高合成语音的准确率。

技术关键词

韵律预测编码器网络韵律特征样本生成语音模型生成方法文本序列语音生成方法模型生成装置数据获取模块计算机程序产品字符处理器机制计算机设备

系统为您推荐了相关专利信息

一种多模态情感识别方法及系统

时间段序列生理信号情感状态识别

一种融合条件扩散的高光谱快照压缩成像重建方法

成像重建方法注意力图像重建模拟成像系统快照

基于大规模扩散编解码的具身执行模型动作生成方法和系统

动作生成方法生成动作编解码解码器编码器

一种换流变阀侧套管载流连接缺陷评定测温点选择方法及系统

阀侧套管测温表带触指支持向量回归机套管外表面

一种基于半监督聚类与动态重采样的短文本不平衡分类方法

分类方法样本标记层次聚类算法动态

基于韵律边界信息和VAE结构的语音合成模型生成方法

站点导航

APP 下载