摘要
本发公开了一种语音合成方法、装置、设备及存储介质,所述方法包括获取待处理的语音及文本数据并将其输入至目标语音合成模型中,以此获取对应声学特征和对应内容的目标合成语音数据;其中,目标语音合成模型的生成是在进行模型训练过程中,通过获取并根据教师语音合成模型和学生语音合成模型输出分布之间的相对熵,来调整学生语音合成模型的模型参数,并在相对熵达到第一预设阈值时,所对应的学生语音合成模型作为目标语音合成模型。通过实施本发明,能够确保目标语音合成模型的表达能力和生成质量的同时,还满足了用户的实时性需求。
技术关键词
训练文本数据
声学特征
学生
语音特征
教师
文本编码器
解码
数据获取模块
语义特征
终端设备
处理器
声波
存储器
参数
信号
计算机
系统为您推荐了相关专利信息
建筑物基座
屋顶
检测网络模型
语义分割网络
建筑物轮廓
数据隐私保护
异常检测方法
多模态
融合特征
动态噪声
质检方法
响应度参数
声学特征
合规性
一致性检测
分类网络
样本
特征提取网络
肿瘤
分类模型训练方法