一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型

正文

推荐专利

申请号：CN202510815121

申请日期：2025-06-18

公开号：CN120636425A

公开日期：2025-09-12

类型：发明专利

摘要

本发明公开了一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型，包括声学模型和声码器；所述声学模型包括说话人编码器、内容编码器、归一化流、后验编码器、梅尔解码器和判别器。优点是：在提高语音转换模型训练效率、音质表现、情感表达与交互控制等方面均实现了显著技术突破，为高质量、可控性强的语音合成系统提供了全新解决方案，具备良好的实用价值与产业应用前景。

技术关键词

解码器编码器音频局部结构特征数据变量自然语音线性声码器指数发音风格参数时序算法频率

一种基于声学模型和声码器解耦架构的高效训练及高表现力语音转换模型

站点导航

APP 下载