摘要
本申请涉及人工智能技术领域,尤其是涉及一种歌声特征转换方法、电子设备、存储介质。本申请的歌声特征转换方法,需要先获取源音频与目标声音标识,再将源音频与目标声音标识输入预先训练的音频处理模型,音频处理模型包括声码器、音乐情感识别网络、变分对抗网络,基于声码器对源音频进行声学特征提取,得到内容特征参数,基于音乐情感识别网络对源音频进行情感信息提取,得到源情感特征向量,再进一步,基于目标声音标识,通过变分对抗网络将源情感特征向量替换为目标情感特征向量,最终基于变分对抗网络对目标情感特征向量与内容特征参数进行重构处理,得到歌声特征转换后的目标音频,能够在实现歌声特征转换的过程中摆脱对平行数据的依赖。
技术关键词
音乐情感识别
韵律特征参数
声码器
音频组
转换方法
网络
标识
频谱特征提取
语句
重构
元素
电子设备
可读存储介质
人工智能技术
偏差
数据
处理器
解码