基于频带分割的声码器音频生成方法、装置、设备及介质

正文

推荐专利

申请号：CN202411387285

申请日期：2024-09-30

公开号：CN119207462B

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及人工智能技术领域和金融科技领域，公开了一种基于频带分割的声码器音频生成方法，通过将输入的音频信号转换为Log梅尔频谱，通过一维卷积网络对频谱信号进行初步处理。信号经过转置卷积进行上采样处理后，利用多感受野模块对不同频带的特征进行提取与处理。在频带分割过程中，信号在通道维度上被分割为多个张量，每个张量对应特定的频带范围，分别进行独立处理。使用PQMF合成滤波器组对已统一通道数的信号再次进行上采样。在信号合并后，通过另一多感受野模块处理最终生成的音频信号。本发明通过频带分割和独立的多感受野模块处理不同频带的张量，减少了转置卷积在上采样过程中引入的频率混叠现象，从而提高了音频生成的质量和自然性。

技术关键词

音频生成方法上采样生成程序多尺度特征提取非线性信号处理频率网络模块生成装置计算机设备滤波器混叠现象人工智能技术多通道处理器

系统为您推荐了相关专利信息

印刷电路板的缺陷检测方法及电子设备

图像策略上采样电路板缺陷检测方法

一种PVC塑料瓦生产用原料自动上料控制系统

原料自动上料控制系统中央控制单元 PID控制算法 PVC塑料瓦电控阀门

基于多源数据融合的飞行器气动特性智能重构方法

飞行器气动特性智能重构方法权重模型气动力特性研究数据

一种薄膜厚度在线测量方法

厚度在线测量方法卷积神经网络模型薄膜光纤探头卤钨灯光源

一种基于剩磁预测的变压器励磁涌流抑制方法

剩磁预测抑制算法电流变压器励磁涌流变压器控制技术

基于频带分割的声码器音频生成方法、装置、设备及介质

站点导航

APP 下载