摘要
本申请提供一种语音转换方法、存储介质、电子设备及程序产品。涉及人工智能技术领域。本申请在进行语音转换时,可以先确定反应源语音语义内容的多维聚类情况的离散目标标签,使源语音的语义编码特征反应源语音的关键语义信息而不包含音色信息。从而使语音转换模型可以直接基于分离的语义特征与音色特征进行语音转换。基于上述转换过程,本申请创造性地将语音转换模型配置为根据样本语音基于样本自身音色的重建情况训练的机器学习模型。即前述语音转换模型在训练时可以直接基于样本语音进行重建并基于重建情况与实际情况的差异进行参数迭代,以使模型的训练数据无需进行人工标注,整个训练过程可以无监督进行。
技术关键词
语音转换方法
编码特征
后验特征
样本
编码器
机器学习模型
电子设备
指令处理器
解码器
波形
文本
音色特征
可读存储介质
人工智能技术
标签
计算机程序产品
语义
系统为您推荐了相关专利信息
图像分割网络
模型训练方法
图像分割方法
编码特征
编码器
输电线路故障
风险评估模型
监测方法
单目摄像头
动态卷积网络