音频编解码方法、电子设备及程序产品

正文

推荐专利

音频编解码方法、电子设备及程序产品

申请号：CN202511270796

申请日期：2025-09-08

公开号：CN120783775B

公开日期：2025-12-09

类型：发明专利

摘要

本发明提供一种音频编解码方法、电子设备及程序产品，涉及音频处理技术领域，该方法包括：获取待处理音频数据，将待处理音频数据转换为频谱图；将频谱图输入至预先训练好的编解码神经网络模型的编码器中，对频谱图依次进行局部声学特征提取、帧内依赖建模和帧间依赖建模，得到编码器输出的编码向量；将编码向量输入至编解码神经网络模型的残差向量量化器中，对编码向量进行多层量化处理，得到残差向量量化器输出的码本索引；将码本索引输入至编解码神经网络模型的解码器中，对码本索引进行解码处理，得到解码器输出的重建频谱图。本发明可在超低码率的通信环境下实现高质量音频还原。

技术关键词

音频编解码方法编码向量解码器索引编码器神经网络模型构建样本积层电子设备数据计算机程序产品处理器教师关系学生变换器

系统为您推荐了相关专利信息

一种面向社交媒体领域的多模态命名实体识别系统及方法

命名实体识别系统命名实体识别模型文本数据多模态

一种视频清晰度提升方法及系统

矩阵纹理索引序列帧像素

一种基于Prophet与LSTM模型融合假期与季节因素的航班计划预测方法

空中交通流量分段线性函数计划解码器时间序列预测模型

一种基于层级知识库的视频帧精准定位方法

知识点关键帧精准定位方法在线教育平台自然语言

用于多模态全面健康数据采集管理方法、系统及存储介质

数据采集管理方法特征提取模型多模态数据采集管理系统指标

音频编解码方法、电子设备及程序产品

站点导航

APP 下载