摘要
本发明涉及语音合成技术领域,尤其涉及一种语音合成方法及装置,该方法包括:固定语音合成模型的参数,以目标对象的真实语音与语音合成模型合成的目标对象的语音之间的相似度更高为优化目标,对初始语音特征向量的特征数值进行更新迭代,得到目标对象的目标语音特征向量;将目标语音特征向量和待合成文本输入到语音合成模型中,合成待合成文本对应的目标语音。本申请通过调整初始语音特征向量的特征数值的方式来合成目标对象的语音,能够降低训练成本,缩短合成耗时,高效适配不同目标对象的语音合成任务。
技术关键词
对象
注意力模型
样本
数值
语音特征分解
文本编码器
参数
解码器
模块
关系