摘要
本公开涉及人工智能领域,尤其涉及一种语音合成方法及装置。该方法包括:获取待处理的第一汉字文本;所述第一汉字文本中包括一个或多个汉字;利用g2pW模型,得到所述第一汉字文本对应的第一拼音文本;将所述第一拼音文本与第二拼音文本进行拼接,得到扩展字符;所述第二拼音文本为音频提示数据对应的拼音文本,所述音频提示数据中包括说话者说出所述第二拼音文本的音频数据;根据所述扩展字符和所述音频提示数据,输出目标语音;所述目标语音为所述说话者说出所述第一汉字文本的语音。该方法应用于根据文本生成语音的场景中。
技术关键词
文本
音频
数据
拼音
字符
汉字
处理单元
模型训练方法
通信接口
发音
可读存储介质
机器学习模型
变换器
训练样本集
生成语音
处理器
声码器
计算机
电子设备