摘要
本发明公开了模型训练、语音生成方法、装置、设备及介质。方法包括:根据目标文本对应的音素特征表示与目标对象声音的嵌入表示,生成携带有目标对象声音特性的先验音素特征分布参数;将目标对象声音的嵌入表示和先验音素特征分布参数输入到第一模型进行一致性知识蒸馏训练,得到第二模型;其中,第二模型从第一模型学习到生成融合目标对象声音特性预测语音的能力。在训练过程中,将目标对象嵌入输入到不同模型中,从而实现整体提升模型输出的语音信息的自然语言表达能力,使得语言信息能够更加准确的体现出目标对象声音特性。此外,采用知识蒸馏方式训练得到第二模型,从而能够有效提升训练效率以及后续模型应用过程中语音生成效率。
技术关键词
对象
语音生成方法
参数
校正
蒸馏
文本
噪声信息
模型训练装置
模型训练方法
索引
整体提升
样本
编码器
生成装置
程序
轨迹
自然语言
系统为您推荐了相关专利信息
电价计算方法
分时电价优化
负荷
遗传算法求解
计算机程序代码
山区公路边坡
位移预测方法
LSTM模型
超参数
数据
实时数据
量计算方法
数据采集频率
流速
监测历史数据
图像处理模型
分类特征
图像处理方法
点云
神经网络模型