一种语音合成方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202410784996

申请日期：2024-06-18

公开号：CN118609540A

公开日期：2024-09-06

类型：发明专利

摘要

本申请提供了一种语音合成方法、装置、电子设备及存储介质，该方法包括：将各语音提供者提供的语音样本数据对应的语音特征数据输入到特征提取模型中，得到各语音提供者对应的语音提供者特征数据；将各语音提供者对应的语音提供者特征数据、文本数据作为样本数据，各语音提供者提供的语音样本数据作为标签，对各语音提供者对应的语音合成模型进行训练；根据训练完成的各语音提供者对应的语音合成模型进行语音合成。本申请通过各语音提供者对应的语音提供者特征数据对语音合成模型进行训练，以通过训练完成的语音合成模型合成自然而流畅的语音，无需提前建立语音库，避免出现无法将文本转化为语音的情况。

技术关键词

语音特征数据编码特征样本 MFCC特征特征提取模型适配器文本解码单元年龄机器可读指令梅尔频率倒谱系数参数电子设备标签处理器可读存储介质

系统为您推荐了相关专利信息

一种基于区块链的数据管理系统

数据管理系统多义词同义词数据管理模块数据管理库

一种基于多模态深度融合模型的胎盘植入性疾病分级诊断方法

图像编码器多模态深度患者数值诊断方法

基于混合深度学习的抗菌肽预测方法及装置

混合深度学习模型抗菌肽节点特征序列网络单元

一种去除图像反光模型的训练方法及装置

编码特征解码模块编码模块卷积特征强化特征

医学图像的跨模态转换方法及系统

医学图像数据医学图像模态转换方法编码器标志

一种语音合成方法、装置、电子设备及存储介质

站点导航

APP 下载