摘要
本发明提供一种音频编解码方法、电子设备及程序产品,涉及音频处理技术领域,该方法包括:获取待处理音频数据,将待处理音频数据转换为频谱图;将频谱图输入至预先训练好的编解码神经网络模型的编码器中,对频谱图依次进行局部声学特征提取、帧内依赖建模和帧间依赖建模,得到编码器输出的编码向量;将编码向量输入至编解码神经网络模型的残差向量量化器中,对编码向量进行多层量化处理,得到残差向量量化器输出的码本索引;将码本索引输入至编解码神经网络模型的解码器中,对码本索引进行解码处理,得到解码器输出的重建频谱图。本发明可在超低码率的通信环境下实现高质量音频还原。
技术关键词
音频编解码方法
编码向量
解码器
索引
编码器
神经网络模型构建
样本
积层
电子设备
数据
计算机程序产品
处理器
教师
关系
学生
变换器
系统为您推荐了相关专利信息
命名实体识别系统
命名实体识别模型
文本
数据
多模态
空中交通流量
分段线性函数
计划
解码器
时间序列预测模型
知识点
关键帧
精准定位方法
在线教育平台
自然语言
数据采集管理方法
特征提取模型
多模态
数据采集管理系统
指标