摘要
本发明涉及人工智能技术领域和金融科技领域,公开了一种基于频带分割的声码器音频生成方法,通过将输入的音频信号转换为Log梅尔频谱,通过一维卷积网络对频谱信号进行初步处理。信号经过转置卷积进行上采样处理后,利用多感受野模块对不同频带的特征进行提取与处理。在频带分割过程中,信号在通道维度上被分割为多个张量,每个张量对应特定的频带范围,分别进行独立处理。使用PQMF合成滤波器组对已统一通道数的信号再次进行上采样。在信号合并后,通过另一多感受野模块处理最终生成的音频信号。本发明通过频带分割和独立的多感受野模块处理不同频带的张量,减少了转置卷积在上采样过程中引入的频率混叠现象,从而提高了音频生成的质量和自然性。
技术关键词
音频生成方法
上采样
生成程序
多尺度特征提取
非线性
信号处理
频率
网络模块
生成装置
计算机设备
滤波器
混叠现象
人工智能技术
多通道
处理器
系统为您推荐了相关专利信息
原料自动上料控制系统
中央控制单元
PID控制算法
PVC塑料瓦
电控阀门
飞行器气动特性
智能重构方法
权重模型
气动力特性研究
数据
厚度在线测量方法
卷积神经网络模型
薄膜
光纤探头
卤钨灯光源
剩磁预测
抑制算法
电流
变压器励磁涌流
变压器控制技术