语音转换模型训练方法、语音转换方法、电子设备及存储介质

正文

推荐专利

申请号：CN202410976926

申请日期：2024-07-18

公开号：CN118918909A

公开日期：2024-11-08

类型：发明专利

摘要

本申请公开一种包括人声编码器、内容编码器和波形生成器的语音转换模型的训练方法，包括预训练内容编码器；预训练人声编码器；以及对抗训练语音转换模型的波形生成器和对应的判别器，对抗训练包括迭代执行下述步骤，直至达到预设的迭代终止条件：将训练音频分别输入内容编码器和人声编码器以输出内容特征和人声特征；将内容特征和人声特征输入波形生成器，生成训练生成音频，由判别器在训练音频和训练生成音频中判别真实音频和/或生成音频；由第一损失值更新波形生成器的参数；由第二损失值更新判别器的参数。本申请方案将通常应用于声码器的对抗训练用于训练声学模型，而省掉了声码器，提升了语音转换的生成效率，减低了训练成本。

技术关键词

人声编码器波形音素后验概率语音转换方法音频特征模型训练方法激励残差网络训练声学模型注意力参数音色特征序列电子设备解码器处理器存储器

系统为您推荐了相关专利信息

基于对抗域生成网络的跨域拉曼光谱识别方法和装置

嵌入特征样本识别方法语义网络

一种多节点并发传输信号叠加分集方法

分集方法 Turbo解码器 Turbo编码器多节点矩阵

基于有监督深度学习的水下无线光通信编解码方法及系统

水下无线光通信监督深度学习编解码方法解码模型发射单元

一种基于对比学习与私有信息的多视图数据类别识别方法

数据类别识别方法语义特征标签邻居自然语言分析

一种基于目标特征增强和语义融合感知的小样本目标检测方法

语义原型通道注意力机制感兴趣样本

语音转换模型训练方法、语音转换方法、电子设备及存储介质

站点导航

APP 下载