摘要
本申请公开一种音频信号处理方法、装置、计算机设备及存储介质,属于人工智能技术领域。音频信号处理方法应用于预先搭建的声码器系统,声码器系统基于变分自编码器搭建而成声码器系统包括先验编码器、后验编码器和解码器。首先,构建损失函数,包含重构损失和编码器之间的差异损失。然后,将原始音频信号输入后验编码器,生成高斯分布,并对该分布进行采样生成中间隐变量,将隐变量输入解码器进行音频重构,生成还原音频信号。通过计算损失并进行优化和迭代训练,获得预训练的声码器系统。最终,利用预训练的声码器系统对待还原的频谱进行处理,生成还原音频信号。本申请有效提升了模型的稳定性,降低了训练难度,同时增强了模型的泛化能力。
技术关键词
声码器系统
音频信号处理方法
音频信号处理装置
编码器参数
计算机可读指令
解码器
频谱特征
变量
音频采样
计算机设备
音频解码模块
传播算法
短时傅里叶变换
离散余弦变换
系统为您推荐了相关专利信息
外围设备
存储设备
模式
电子设备
计算机可读指令
能源优化调度方法
综合能源系统
强化学习模型
KKT条件
变量
冠状动脉粥样硬化
易损斑块
历史大数据
图像
计算机可读取存储介质
多层卷积神经网络
位点
单核苷酸多态性
计算机可读指令
基因组拼接