语音合成方法及装置

正文

推荐专利

语音合成方法及装置

申请号：CN202510555012

申请日期：2025-04-29

公开号：CN120431902A

公开日期：2025-08-05

类型：发明专利

摘要

本申请公开了一种语音合成方法，属于语音处理技术领域。该方法包括：获取音频数据和文本数据并进行预处理，得到token字典；将token字典输入到文本‑语音模型中，得到文本‑语音令牌集；将文本‑语音令牌集输入到因果流匹配模型中，得到梅尔频谱图；将梅尔频谱图输入到声码器模型中，输出目标语音。该方法提升了语音合成的速度和质量。

技术关键词

语音令牌语义特征字典音频数据非暂态计算机可读存储介质文本编码器韵律特征处理器融合算法注意力机制输出模块序列波形上采样存储器电子设备

系统为您推荐了相关专利信息

一种供应链优化方法、系统、智能终端及存储介质

供应链优化方法管理策略自然语言物料运输效率矩阵

一种光纤网络线路巡检装置

线路巡检装置光纤网络接线端口信号发射器调频模块

基于转换器模型进行视听模态融合的具身视听导航方法

音频编码器深度编码器视听导航方法转换器

一种应用于文本转语音的大规模语音克隆模型智能管理方法

语音智能管理方法负载均衡器文本智能管理系统

图像生成方法、设备、存储介质及程序产品

图像生成模型多模态多媒体预训练语言模型文本

语音合成方法及装置

站点导航

APP 下载