摘要
本申请公开了一种语音生成方法、装置、产品、设备及介质,应用于语音生成技术领域,包括:利用量化器对原始语音信号的语音特征向量进行离散化,得到所述原始语音信号对应的离散码元表示,其中,所述量化器由语音信号训练样本对自组织映射网络进行训练得到;提取目标文本对应的文本特征;将所述文本特征和所述离散码元表示输入语音生成模型,以使所述语音生成模型以所述文本特征作为条件,并基于所述离散码元表示生成目标语音。这样,能够更精确的还原原始语音特征,提高生成语音质量。
技术关键词
语音生成方法
语音生成模型
邻域
文本
语音生成技术
信号
计算机程序产品
组织
网络
量化器
特征提取模块
生成语音
语音特征
生成装置
处理器
可读存储介质
存储器
电子设备