一种音频处理方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411053243

申请日期：2024-08-02

公开号：CN118571238B

公开日期：2024-11-12

类型：发明专利

摘要

本申请提供了一种音频处理方法、装置、电子设备及存储介质，包括：将待处理音频输入至语音处理模型的编码器网络层之中，对待处理音频的特征向量进行固定维度编码处理，输出待处理音频的离散化特征向量；将离散化特征向量输入至量化器网络层之中，对离散化特征向量进行残差矢量量化处理，输出待处理音频的残差矢量量化特征向量；将残差矢量量化特征向量输入至解码器网络层之中，对残差矢量量化特征向量进行解码处理，输出重建后的待处理音频。结合声码器监督分支的语音处理模型可以把音频信号编码为离散的表示，在声码器的辅助监督下提高重建的音频质量，保证模型性能不降低的情况下提高处理速度。

技术关键词

矢量量化声码器神经网络模型量化器样本解码器语音编码器波形机器可读指令模型训练模块音频信号编码电子设备处理器可读存储介质分支存储器

系统为您推荐了相关专利信息

基于图卷积网络的匿名说话人攻击方法

特征提取器矢量量化网络说话人身份信息语言转换技术

一种用于疏水阀的检漏方法及系统

疏水阀检漏方法传感器阵列基准参数

一种作业车辆的导航方法、装置、电子设备及介质

作业车辆图像锚点导航方法坐标

基于低算力设备的教学行为智能识别方法和系统

智能识别系统教学神经网络模型数据采集模块智能识别方法

一种太赫兹超材料增强型光谱检测系统

太赫兹超材料光谱检测系统拓扑网络因子谐振

一种音频处理方法、装置、电子设备及存储介质

站点导航

APP 下载