摘要
本申请公开了一种语音合成方法、语音合成模型训练方法及相关装置,该方法包括:获取待合成的目标文本和目标语音;提取目标语音中说话人的声音特征;基于说话人的声音特征和目标文本,生成目标合成语音,目标合成语音为参考目标语音的声音特点、且发音内容与目标文本一致的语音;其中,声音特征是利用Q‑former提取得到;和/或,目标合成语音是利用目标语音合成模型生成的,目标语音合成模型是按照用户对第一样本合成语音的偏好程度,对初始语音合成模型进行强化学习得到,第一样本合成语音为利用初始语音合成模型生成。通过上述方式,本申请能够提高目标合成语音的质量。
技术关键词
样本
注意力
音频特征
子模块
声纹验证系统
模型训练方法
文本
语音识别系统
发音
模型训练装置
网络
参数
可读存储介质
处理器
编码
存储器
程序
指令
系统为您推荐了相关专利信息
智能机器人系统
基站
回程
工作模块
自动换装方法
图像分割方法
融合特征
视觉特征
多模态特征
跨模态