一种基于NPU的中英双语文本转语音方法及系统

正文

推荐专利

申请号：CN202511117623

申请日期：2025-08-11

公开号：CN120932627A

公开日期：2025-11-11

类型：发明专利

摘要

本申请公开了一种基于NPU的中英双语文本转语音方法及系统，属于语音处理技术领域，所述方法为：基于中英混合文本中各片段的语言类型，对中英混合文本进行分词处理和音素转换，得到文本输入序列；对音素ID序列和语言ID序列进行向量组合，从向量组合结果中提取文本语义特征，得到文本隐变量；根据文本隐变量，预测每个音素的持续时长和在声学潜在特征空间上的先验分布参数；将音素对齐结果和所述先验分布参数进行若干级变换，得到双语声学特征序列；将所述双语声学特征序列转换为对应的语音波形。因此通过实施本申请，能够解决现有技术存在的中英双语文本在语音转换的过程中占用较多资源且输出的语音质量较低的问题。

技术关键词

文本转语音方法声学特征序列变量文本转语音系统随机噪声特征提取模块分词数据编码语义特征提取参数子模块波形发音终端设备上采样

系统为您推荐了相关专利信息

一种基于机器学习的机器人外设控制方法及系统

外设控制系统深度神经网络模型外设控制方法控制策略多任务联合训练

一种基于相对功角偏移轨迹的暂态功角稳定模式识别方法及系统

暂态功角模式识别方法机组虚拟同步机模式识别系统

推荐方法以及电子设备

序列对象标签推荐方法门控循环单元

一种强化学习驱动的伴游机器人景点路线智能规划管理方法

避雨设施强化学习策略生理管理方法机器人

一种基于临床诊断变量的神经梅毒检测与预测模型及模型的构建方法与应用

神经梅毒检测风险预测模型变量共济失调患者

一种基于NPU的中英双语文本转语音方法及系统

站点导航

APP 下载