摘要
本发明涉及音频处理技术领域,尤其是指一种歌声转换方法及歌声转换系统,所述方法包括:对获取的原始音频数据进行人声分离,得到干净人声数据;对所述干净人声数据进行切片处理,去除静默声音,得到人声切片数据;将所述人声切片数据作为训练数据集,构建歌声转换模型,以最小化损失函数的值为目标,通过所述训练数据集对所述歌声转换模型进行训练,得到训练后的歌声转换模型;将待转换的音频数据输入到所述训练后的歌声转换模型中,得到最终的目标歌声。本发明综合了精细的音频预处理、创新的模型架构与特征提取方法、以及灵活的损失函数设计,实现了高效且高质量的歌声转换。
技术关键词
人声
转换方法
音频
音色特征
语义特征
BERT模型
数据获取模块
切片
特征提取模型
依赖特征
文本
计算方法
语音特征
发声
损失函数设计
特征提取方法
采样点
频率转换
系统为您推荐了相关专利信息
虚假评论检测方法
BERT模型
矩阵
文本
分类器