摘要
本申请公开了一种语音合成方法、装置、设备和存储介质,该方法包括:获取目标文本对应的编码特征;基于目标情感类型以及目标情感强度系数,生成情感强度特征;融合情感强度特征和编码特征,生成声学表征;基于声学表征,生成所述目标文本对应且具有情感的语音数据。通过上述方法,本申请能够使得生成的语音数据更具有生动性。
技术关键词
情感特征
编码特征
特征提取模型
文本
情感分类器
强度
样本
发音
数据
时序特征
语音
基准
二分类器
音频特征
代表
存储程序指令
特征提取网络
可读存储介质
系统为您推荐了相关专利信息
图像修复模型
特征信息融合
人脸识别模型
模板
特征提取模型
对象
文本生成方法
案件
计算机程序产品
校验模型
关键词提取方法
玩家
BERT模型
TextRank算法
文本
模型训练方法
文本生成方法
样本
文本生成装置
模型训练装置