摘要
本申请公开了一种语音合成方法、装置及电子设备,涉及语音处理技术领域。所述方法包括:获取目标对象的歌唱音频和待合成文本;确定所述待合成文本的文本向量,以及所述歌唱音频的音频向量;基于所述文本向量和所述音频向量,利用目标语音合成模型生成目标语音频谱;其中,所述目标语音合成模型在生成所述目标语音频谱时,能够通过特征提取模块提取侧重于所述目标对象的说话属性特征的目标语音特征,并弱化所述目标对象的歌唱属性特征。
技术关键词
语音分类模型
文本
音频
样本
特征提取模块
语音特征
对象
声纹特征
序列
电子设备
参数
生成语音
存储器
指令
波形
数据
处理器
编码