音频编解码方法、电子设备及程序产品

AITNT
正文
推荐专利
音频编解码方法、电子设备及程序产品
申请号:CN202511270796
申请日期:2025-09-08
公开号:CN120783775B
公开日期:2025-12-09
类型:发明专利
摘要
本发明提供一种音频编解码方法、电子设备及程序产品,涉及音频处理技术领域,该方法包括:获取待处理音频数据,将待处理音频数据转换为频谱图;将频谱图输入至预先训练好的编解码神经网络模型的编码器中,对频谱图依次进行局部声学特征提取、帧内依赖建模和帧间依赖建模,得到编码器输出的编码向量;将编码向量输入至编解码神经网络模型的残差向量量化器中,对编码向量进行多层量化处理,得到残差向量量化器输出的码本索引;将码本索引输入至编解码神经网络模型的解码器中,对码本索引进行解码处理,得到解码器输出的重建频谱图。本发明可在超低码率的通信环境下实现高质量音频还原。
技术关键词
音频编解码方法 编码向量 解码器 索引 编码器 神经网络模型构建 样本 积层 电子设备 数据 计算机程序产品 处理器 教师 关系 学生 变换器
系统为您推荐了相关专利信息
1
一种面向社交媒体领域的多模态命名实体识别系统及方法
命名实体识别系统 命名实体识别模型 文本 数据 多模态
2
一种视频清晰度提升方法及系统
矩阵 纹理 索引 序列帧 像素
3
一种基于Prophet与LSTM模型融合假期与季节因素的航班计划预测方法
空中交通流量 分段线性函数 计划 解码器 时间序列预测模型
4
一种基于层级知识库的视频帧精准定位方法
知识点 关键帧 精准定位方法 在线教育平台 自然语言
5
用于多模态全面健康数据采集管理方法、系统及存储介质
数据采集管理方法 特征提取模型 多模态 数据采集管理系统 指标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号