音频编码方法、装置、电子设备及可读存储介质

正文

推荐专利

申请号：CN202510094788

申请日期：2025-01-21

公开号：CN119785804A

公开日期：2025-04-08

类型：发明专利

摘要

本申请公开了一种音频编码方法、装置、电子设备及可读存储介质，属于人工智能技术领域，该方法包括：提取第一音频的第一梅尔频谱特征；将所述第一梅尔频谱特征划分为N个不同频率范围的子带，得到N个子带特征；其中，所述N个不同频率范围之间互不重叠；对每个所述子带特征进行量化编码，得到每个所述子带特征的量化编码值；根据预设量化码表和每个所述子带特征的量化编码值，确定每个所述子带特征的索引值；其中，所述量化码表包含量化编码值与索引值之间的映射关系，所述索引值为整数，N个所述子带特征的索引值构成所述第一音频对应的一组训练数据，所述训练数据用于训练文生语音模型。

技术关键词

频谱特征音频编码方法编码器编码结构生成对抗网络残差模块索引码表双曲正切函数子模块解码结构编码模块电子设备可读存储介质频率人工智能技术

音频编码方法、装置、电子设备及可读存储介质

站点导航

APP 下载