摘要
本申请实施例提供的语音合成方法、电子设备、存储介质及程序产品,获取目标语种的第一文本语音数据对,对第一语音数据进行编码,得到第一音频向量,通过预设的音素内容提取器提取第一文本数据,得到第二内容向量,并融合第一音色向量、第二内容向量、第一韵律向量和第一声音细节向量,得到第二音频向量,通过第一解码器对第二音频向量进行解码,得到第二语音数据。实现如下技术效果:通过文本数据训练的内容向量替换语音数据中的内容向量解决语音合成不流畅的问题。
技术关键词
文本
计算机执行指令
数据
音频
编码器
语音特征
迭代优化算法
分解器
解码器
专用符号
序列
电子设备
可读存储介质
计算机程序产品
处理器
解码模块
编码模块
系统为您推荐了相关专利信息
免疫细胞
生物标志物
软组织
数据输入模块
人工智能方法
元数据服务器节点
数据存储
数据归档方法
计划
集群
冲压控制方法
模拟退火算法
机器学习模型
可行解空间
逻辑回归模型
禁忌搜索算法
文本分类方法
训练深度学习模型
样本
BERT模型