语音合成方法、系统、设备、存储介质以及程序产品

正文

推荐专利

申请号：CN202511146641

申请日期：2025-08-15

公开号：CN120808749A

公开日期：2025-10-17

类型：发明专利

摘要

本申请提供了一种语音合成方法、系统、设备、存储介质及程序产品，涉及人工智能与语音处理技术领域，方法包括：获取与待合成语音文本数据相对应的梅尔频谱数据；将所述梅尔频谱数据输入基于选择性状态空间模型的神经声码器；基于所述神经声码器采用所述选择性状态空间模型对所述梅尔频谱数据进行长序列处理，得到与所述待合成语音文本数据相对应的合成音频数据。采用本申请能够基于状态空间模型构建神经声码器进行语音合成，提升高频重建能力避免高频细节的丢失，从而获得更好的合成音质。

技术关键词

状态空间模型声码器时序依赖关系语音生成对抗网络训练序列音频文本生成对抗网络模型计算机程序产品解码器可读存储介质数据获取模块处理器编码模块波形存储器

系统为您推荐了相关专利信息

根据面试问题答案进行评分追问方法、装置和电子设备

答案电子设备处理器数学模型参数

基于移动通讯设备的AI通讯管理系统及方法

移动通讯设备通讯管理方法通讯管理系统管理关键词特征提取单元

一种基于人工智能的动态心电图预警系统

动态心电图预警系统长短期记忆网络深度学习模型指示标签

一种文本的预告片生成方法、系统、设备及存储介质

语音生成模型视频生成模型文本生成方法语音特征

混合语音识别文本的标点预测方法、装置、计算机设备、可读存储介质和程序产品

文本识别模型字符语音活动检测系统混合语音识别标点预测方法

语音合成方法、系统、设备、存储介质以及程序产品

站点导航

APP 下载