文本到语音的生成方法、装置及电子设备

正文

推荐专利

文本到语音的生成方法、装置及电子设备

申请号：CN202411066953

申请日期：2024-08-05

公开号：CN118629395A

公开日期：2024-09-10

类型：发明专利

摘要

本申请涉及计算机技术领域，公开了一种文本到语音的生成方法、装置及电子设备，该方法包括：获取待处理文本和目标参考语音；对待处理文本进行预处理，得到待处理文本对应的目标编码；基于目标编码、目标参考语音，以及目标语音生成模型中的风格向量单元，生成目标风格向量；基于目标风格向量、待处理文本，以及目标语音生成模型中的生成单元，生成待处理文本和目标参考语音对应的目标合成语音。本申请实施例提供的文本到语音的生成方法所生成的目标合成语音具有待处理文本的韵律特征和目标参考语音的韵律特征，提高了合成语音的真实性和丰富性。

技术关键词

语音生成模型文本风格韵律特征特征提取器编码器生成方法梅尔频率倒谱系数序列音频特征方差信息样本注意力机制采样器电子设备适配器模块数据

系统为您推荐了相关专利信息

一种基于人工智能技术的多维度人才评估方法及系统

人才评估方法人工智能技术序列文本 BERT模型

问答方法分块方法文本问答装置参数

儿童相机照片微调技术风格重建三维模型

关键词锚点医院分析单元对象

分布特征数据分布分类方法样本支持向量机模型

文本到语音的生成方法、装置及电子设备

站点导航

APP 下载