语音合成方法、装置、存储介质及电子设备

正文

推荐专利

语音合成方法、装置、存储介质及电子设备

申请号：CN202410979840

申请日期：2024-07-22

公开号：CN118824224A

公开日期：2024-10-22

类型：发明专利

摘要

本申请公开了一种语音合成方法、装置、存储介质及电子设备，涉及人工智能技术领域，包括：首先获取待语音合成的目标文本；然后将所述目标文本输入到语音合成模型中，所述语音合成模型采用VITS模型架构作为基础架构，并采用Duration Predictor替换所述VITS模型架构中的对齐结构，所述语音合成模型包括Pitch Decoder；再利用所述Duration Predictor，获取所述目标文本对应的音素的目标时长，以及利用所述Pitch Decoder，获取所述音素的目标基频；最后根据所述目标时长和所述目标基频合成所述目标文本对应的目标语音，作为所述语音合成模型的输出结果。本申请的技术方案能够提高语音合成质量，改善文本转语音的效果。

技术关键词

样本语音标签音频解码器训练集计算机程序产品文本编码器电子设备处理器人工智能技术变量指标生成方法输入模块可读存储介质参数

系统为您推荐了相关专利信息

一种工业流程剩余时间预测方法、装置及存储介质

序列轨迹工业注意力机制语义

基于物理信息驱动的近β钛合金多性能预测方法

多性能预测方法近β钛合金 XGBoost模型物理特征参数机器学习模型

一种基于双路径训练的无监督多模态图像配准方法及系统

多模态图像数据表达式图像配准系统上采样图像像素

一种用于计算中心的制冷系统能耗优化方法、系统及介质

计算中心能耗优化方法配置制冷系统因子主机

一种基于近端对抗约束策略搜索的离线强化学习方法

强化学习方法离线随机梯度下降策略更新损失函数设计

语音合成方法、装置、存储介质及电子设备

站点导航

APP 下载