摘要
本申请实施例提供了一种语音转换模型训练方法、装置、计算机设备及存储介质,属于人工智能技术领域。包括:获取样本语音以及样本语音的样本音色特征和样本文本特征,获取参考语音的参考语音特征和参考音色特征;将样本语音输入到训练后的编码子模型中,输出样本语音的样本语音特征;将样本语音特征、样本文本特征和样本音色特征正向输入到可逆生成子模型中,输出目标文本特征,并确定目标文本特征和样本文本特征之间的第一损失值;将目标文本特征和参考音色特征逆向输入到可逆生成子模型中,输出目标语音特征,并确定目标语音特征和参考语音特征之间的第二损失值;根据第一损失值和第二损失值对可逆生成子模型迭代,得到训练后的可逆生成子模型。
技术关键词
语音特征
音色特征
样本
模型训练方法
文本
编码
计算机设备
输入模块
解码
模型训练装置
可读存储介质
人工智能技术
处理器
存储器
指令
参数
网络
系统为您推荐了相关专利信息
动作捕捉方法
多目相机
动作捕捉装置
动作识别模型
关节点
FTIR光谱
推断方法
大鼠
骨骼肌组织
PCA算法
语音智能识别方法
农业病虫害
卷积神经网络模型
深度学习技术
样本
支持向量机模型
强化学习模型
训练样本数据
场景
决策树模型