语音合成方法和装置、电子设备及存储介质

正文

推荐专利

语音合成方法和装置、电子设备及存储介质

申请号：CN202411693142

申请日期：2024-11-22

公开号：CN119541454A

公开日期：2025-02-28

类型：发明专利

摘要

本申请实施例提供了一种语音合成方法和装置、电子设备及存储介质，属于语音合成技术领域，适用于金融科技领域。该方法包括：获取语音合成文本及目标音频数据；获取初始语音特征提取子模型、文本编码子模型及音频信号生成子模型；基于语音样本数据对初始语音特征提取子模型进行训练，得到目标语音特征提取子模型；基于目标语音特征提取子模型，对目标音频数据进行特征提取，得到目标音频特征向量；基于文本编码子模型，对语音合成文本进行文本编码，得到文本编码向量；基于目标音频特征向量，对文本编码向量进行向量映射，得到语音编码向量；基于音频信号生成子模型，对语音编码向量进行语音合成。本申请实施例能够提高合成语音特征的多样性。

技术关键词

语音特征提取语音编码编码向量文本音频编码离散特征数据码字声学特征音频特征电子设备模型训练模块可读存储介质样本特征提取模块信号声波

系统为您推荐了相关专利信息

图像描述方法、系统、存储介质及电子设备

大语言模型电子设备模块场景对象

建筑工程图纸跳转链接自动生成方法、装置、设备及介质

自动生成方法工程图纸对象锚点建筑

人脸属性编辑模型的训练和应用方法、装置、设备及介质

人脸属性编辑标签文本编码器结构

多模型压缩方法、装置、任务处理方法、设备及存储介质

模型压缩方法节点矩阵多模型参数

基于多模态大模型的智能审计方法及系统

智能审计方法多模态结构化业务数据财会多通道并行

语音合成方法和装置、电子设备及存储介质

站点导航

APP 下载