摘要
本申请实施例公开离散语音编码方法、电子设备和存储介质,其中,方法包括:构造一个语音输入、频谱输出的VAE,并使所述输入语音带有说话人音色扰动,所述VAE结构用于进行多任务学习;对所述VAE进行向量量化,初始化一个VQ‑VAE,以加入量化层继续缩小信息瓶颈;以及额外训练一个声码器,从所述VQ‑VAE中得到的编码出发,进行波形的重构。
技术关键词
语音编码方法
声码器
重构
量化器
解码器
波形
多任务
电子设备
注意力
处理器通信
瓶颈
采样率
存储器
编码器
算法
指令
序列
系统为您推荐了相关专利信息
超参数
精密系统
空间分析方法
数据
梯度下降算法
触摸显示屏
热点
声波发生器
重构声场
耦合动力学模型
多尺度建模方法
母线
数字孪生模型
有限元网格模型
物理