训练文本转语音模型、文本转语音的方法、装置及设备

AITNT
正文
推荐专利
训练文本转语音模型、文本转语音的方法、装置及设备
申请号:CN202410801337
申请日期:2024-06-19
公开号:CN119007706A
公开日期:2024-11-22
类型:发明专利
摘要
本说明书实施例公开了一种训练文本转语音模型、文本转语音的方法、装置及设备。重新定义了文本转语音模型的输入数据的构成,输入数据不仅包括已插入韵律符号的文本对应的音素序列,也包括能够表示文本在至少一个粒度层级上的结构划分的结构标注信息,从而使得文本转语音模型在进行语音特征预测的过程中,不仅可以参考文本在音素层面的韵律,而且还可以参考文本在单字词、短语、语句等粒度层面上的韵律,这样可以使得预测出的语音特征所得到的语音韵律具有文本结构上发音的连贯性,韵律更加自然。需要说明,本公开属于人工智能领域的技术方案,在方案实现时,所使用的隐私数据已经得到所有方授权。
技术关键词
文本 层级 韵律模型 符号 序列 语音特征 样本 算法框架 编码特征 模块 回归算法 计算机程序产品 处理器 发音 语句 元素 存储器 编码器 电子设备
系统为您推荐了相关专利信息
1
一种软件版本功能项测试方法、装置、设备及存储介质
对照功能 树形结构数据 测试方法 目录 计算机程序指令
2
一种基于新安江-自注意力的径流预测方法、装置和介质
新安江模型 径流预测方法 历史降雨量 注意力 汇流
3
导线舞动监测方法及相关设备
导线舞动监测方法 加速度 舞动监测系统 输出警示信息 主控模块
4
一种基于大模型和知识向量库的数据分析问答平台
关键词 自然语言数据分析 语句 符号特征 指标
5
一种超声图像优化方法及装置
超声图像优化方法 信号 生成超声图像 分布式图像处理 噪声数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号