摘要
本申请提供了一种音频处理方法、装置、电子设备及存储介质,包括:将待处理音频输入至语音处理模型的编码器网络层之中,对待处理音频的特征向量进行固定维度编码处理,输出待处理音频的离散化特征向量;将离散化特征向量输入至量化器网络层之中,对离散化特征向量进行残差矢量量化处理,输出待处理音频的残差矢量量化特征向量;将残差矢量量化特征向量输入至解码器网络层之中,对残差矢量量化特征向量进行解码处理,输出重建后的待处理音频。结合声码器监督分支的语音处理模型可以把音频信号编码为离散的表示,在声码器的辅助监督下提高重建的音频质量,保证模型性能不降低的情况下提高处理速度。
技术关键词
矢量量化
声码器
神经网络模型
量化器
样本
解码器
语音
编码器
波形
机器可读指令
模型训练模块
音频信号编码
电子设备
处理器
可读存储介质
分支
存储器
系统为您推荐了相关专利信息
特征提取器
矢量量化
网络
说话人身份信息
语言转换技术
智能识别系统
教学
神经网络模型
数据采集模块
智能识别方法