摘要
本申请提供一种语音合成、模型训练方法、系统、设备、介质及程序产品,语音合成方法包括:获取待处理的语音数据、用于描述说话风格的风格描述文本以及目标文字;通过语音合成模型,基于语音数据提取声音特征,并基于风格描述文本确定说话风格特征;基于声音特征以及说话风格特征,将目标文字转换为目标语音;输出目标语音。本申请可以提高语音合成的灵活性。
技术关键词
语义向量
风格
语音
样本
文本
语义特征提取
特征提取模块
编码
模型训练方法
计算机执行指令
数据
服务端
融合特征
噪声
客户端
处理器
可读存储介质
计算机程序产品
电子设备
系统为您推荐了相关专利信息
医疗影像数据
样本
关键词
辅助评估系统
特征提取模型
线虫
特征提取模型
身份认证方法
预处理图像数据
生理特征识别
图像配准模型
并行特征
图像特征提取模型
分支
网络
无人机电量
无人机巡检路径
节点
解码模块
编码模块