离散语音编码方法、电子设备和存储介质

AITNT
正文
推荐专利
离散语音编码方法、电子设备和存储介质
申请号:CN202411448242
申请日期:2024-10-16
公开号:CN119296556A
公开日期:2025-01-10
类型:发明专利
摘要
本申请实施例公开离散语音编码方法、电子设备和存储介质,其中,方法包括:构造一个语音输入、频谱输出的VAE,并使所述输入语音带有说话人音色扰动,所述VAE结构用于进行多任务学习;对所述VAE进行向量量化,初始化一个VQ‑VAE,以加入量化层继续缩小信息瓶颈;以及额外训练一个声码器,从所述VQ‑VAE中得到的编码出发,进行波形的重构。
技术关键词
语音编码方法 声码器 重构 量化器 解码器 波形 多任务 电子设备 注意力 处理器通信 瓶颈 采样率 存储器 编码器 算法 指令 序列
系统为您推荐了相关专利信息
1
基于Transformer的超参空间分析方法、装置、电子设备和存储介质
超参数 精密系统 空间分析方法 数据 梯度下降算法
2
一种多源威胁情报隐私融合处理方法及系统
指标 跨模态 实体 字段 组织
3
一种高效通风散热的触摸显示屏系统
触摸显示屏 热点 声波发生器 重构声场 耦合动力学模型
4
一种基于机器视觉技术的全自动索振动高精度测量方法
高精度测量方法 机器视觉技术 像素 拉索 强度
5
用于硬母线的加工制作方法及系统
多尺度建模方法 母线 数字孪生模型 有限元网格模型 物理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号