摘要
本申请公开了一种基于NPU的中英双语文本转语音方法及系统,属于语音处理技术领域,所述方法为:基于中英混合文本中各片段的语言类型,对中英混合文本进行分词处理和音素转换,得到文本输入序列;对音素ID序列和语言ID序列进行向量组合,从向量组合结果中提取文本语义特征,得到文本隐变量;根据文本隐变量,预测每个音素的持续时长和在声学潜在特征空间上的先验分布参数;将音素对齐结果和所述先验分布参数进行若干级变换,得到双语声学特征序列;将所述双语声学特征序列转换为对应的语音波形。因此通过实施本申请,能够解决现有技术存在的中英双语文本在语音转换的过程中占用较多资源且输出的语音质量较低的问题。
技术关键词
文本转语音方法
声学特征
序列
变量
文本转语音系统
随机噪声
特征提取模块
分词
数据编码
语义特征提取
参数
子模块
波形
发音
终端设备
上采样
系统为您推荐了相关专利信息
外设控制系统
深度神经网络模型
外设控制方法
控制策略
多任务联合训练
暂态功角
模式识别方法
机组
虚拟同步机
模式识别系统