摘要
本申请属于人工智能领域及医疗健康领域,涉及一种复合风格语音的生成方法,包括获取文本序列,利用文本编码器对文本序列进行特征提取,得到文本语义信息,其中文本语义信息包括语义特征向量和韵律特征向量;通过风格专家模块的每个风格专家网络对文本语义信息进行风格转换,得到多个风格语音特征;获取目标风格条件,通过门控网络对文本语义信息和目标风格条件进行处理,得到风格权重,根据风格权重对多个风格语音特征进行加权求和操作,得到复合风格特征;通过语音合成器对复合风格特征进行转换,得到文本序列的复合风格语音。此外,本申请还涉及区块链技术,目标页面等可存储于区块链中。本申请能提高复合风格语音的流畅性。
技术关键词
风格
语音特征
语音合成器
语义
文本编码器
生成方法
序列
网络
标签
模块
计算机设备
韵律预测
医疗健康
区块链技术
训练集
处理器通信
系统为您推荐了相关专利信息
排序策略
骨架点云
状态空间方程
校准
解码器单元