基于韵律边界信息和VAE结构的语音合成模型生成方法

AITNT
正文
推荐专利
基于韵律边界信息和VAE结构的语音合成模型生成方法
申请号:CN202411037244
申请日期:2024-07-31
公开号:CN119107931B
公开日期:2025-07-22
类型:发明专利
摘要
本申请涉及一种基于韵律边界信息和VAE结构的语音合成模型生成方法。所述方法包括:获取训练数据集;训练数据集包括样本语音以及样本语音对应的韵律边界信息、文本信息和音素信息;根据样本语音以及对应的音素信息,训练语音合成网络,得到训练后的语音合成网络;根据样本语音以及对应的韵律边界信息,训练韵律编码网络,得到训练后的韵律编码网络;根据样本语音以及对应的文本信息、音素信息和韵律边界信息,训练韵律预测网络,得到训练后的韵律预测网络;根据训练后的语音合成网络、训练后的韵律编码网络和训练后的韵律预测网络,生成基于韵律边界信息和VAE结构的语音合成模型。采用本方法能够生成具有准确韵律的合成语音,提高合成语音的准确率。
技术关键词
韵律预测 编码器 网络 韵律特征 样本 生成语音 模型生成方法 文本 序列 语音生成方法 模型生成装置 数据获取模块 计算机程序产品 字符 处理器 机制 计算机设备
系统为您推荐了相关专利信息
1
一种多模态情感识别方法及系统
时间段 序列 生理 信号 情感状态识别
2
一种融合条件扩散的高光谱快照压缩成像重建方法
成像重建方法 注意力 图像重建 模拟成像系统 快照
3
基于大规模扩散编解码的具身执行模型动作生成方法和系统
动作生成方法 生成动作 编解码 解码器 编码器
4
一种换流变阀侧套管载流连接缺陷评定测温点选择方法及系统
阀侧套管 测温 表带触指 支持向量回归机 套管外表面
5
一种基于半监督聚类与动态重采样的短文本不平衡分类方法
分类方法 样本 标记 层次聚类算法 动态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号