摘要
本申请涉及一种歌声转换模型训练方法、歌曲音色转换方法、计算机设备、计算机可读存储介质和计算机程序产品,涉及歌声合成技术领域,能够提高用户转换歌曲音色的效率。歌声转换模型训练方法包括:获取样本歌曲及与样本歌曲配对的歌唱人音色描述文本;由歌声转换模型中的音频编码模块获取样本歌曲的音色特征,以及,由歌声转换模型中的文本编码模块获取歌唱人音色描述文本对应的文本特征;根据音色特征与文本特征的差异,调整歌声转换模型的模型参数,得到训练好的歌声转换模型;训练好的歌声转换模型用于通过文本编码模块提取输入的音色描述文本对应的文本特征,并根据音色描述文本对应的文本特征得到目标音色特征,进行歌曲音色转换。
技术关键词
音色特征
音色转换方法
文本
音频特征
模型训练方法
发音特征
编码模块
解码模块
音频编码
样本
计算机程序产品
计算机设备
可读存储介质
处理器
参数
存储器
系统为您推荐了相关专利信息
数据治理方法
政务
门控循环单元
文本分类模型
全局特征提取
模态特征
关系发现方法
多模态信息融合
交叉注意力机制
关系网络