摘要
本申请提供一种基于机器学习算法的音色转换方法及系统,首先获取源音频信号和目标音色描述,将源音频信号分解为多个音频帧并提取频谱特征,把目标音色描述转换为多维音色特征向量,然后通过音色融合网络进行特征融合得到转换后频谱特征,再经过逆时频变换生成目标音频信号。此外,还涉及对转换后频谱特征的动态范围调整以及对目标音频信号的后处理等步骤,以提高音色转换的质量和效果,解决多种复杂情况下的音色转换问题。
技术关键词
音色转换方法
频谱特征
机器学习算法
音频信号分解
节奏特征
解码器
音色特征
非周期性噪声
信号处理模块
编码器
执行傅里叶变换
梅尔频率倒谱系数
噪声抑制
谐波
重构参数
可读存储介质
文本