训练文本转语音模型、文本转语音的方法、装置及设备

正文

推荐专利

申请号：CN202410801337

申请日期：2024-06-19

公开号：CN119007706A

公开日期：2024-11-22

类型：发明专利

摘要

本说明书实施例公开了一种训练文本转语音模型、文本转语音的方法、装置及设备。重新定义了文本转语音模型的输入数据的构成，输入数据不仅包括已插入韵律符号的文本对应的音素序列，也包括能够表示文本在至少一个粒度层级上的结构划分的结构标注信息，从而使得文本转语音模型在进行语音特征预测的过程中，不仅可以参考文本在音素层面的韵律，而且还可以参考文本在单字词、短语、语句等粒度层面上的韵律，这样可以使得预测出的语音特征所得到的语音韵律具有文本结构上发音的连贯性，韵律更加自然。需要说明，本公开属于人工智能领域的技术方案，在方案实现时，所使用的隐私数据已经得到所有方授权。

技术关键词

文本层级韵律模型符号序列语音特征样本算法框架编码特征模块回归算法计算机程序产品处理器发音语句元素存储器编码器电子设备

系统为您推荐了相关专利信息

一种软件版本功能项测试方法、装置、设备及存储介质

对照功能树形结构数据测试方法目录计算机程序指令

一种基于新安江-自注意力的径流预测方法、装置和介质

新安江模型径流预测方法历史降雨量注意力汇流

导线舞动监测方法及相关设备

导线舞动监测方法加速度舞动监测系统输出警示信息主控模块

一种基于大模型和知识向量库的数据分析问答平台

关键词自然语言数据分析语句符号特征指标

一种超声图像优化方法及装置

超声图像优化方法信号生成超声图像分布式图像处理噪声数据

训练文本转语音模型、文本转语音的方法、装置及设备

站点导航

APP 下载