摘要
本申请实施例属于语音合成技术领域,应用于声音转换场景中,涉及一种语音转换方法、装置、设备及其存储介质,包括获取待进行发音转换的语音和目标发音用户的参考语音,输入预训练完成的特征解耦模型,分别获得待进行发音转换的语音和目标发音用户的参考语音的解耦特征;将待进行发音转换的语音的文本特征和目标发音用户的参考语音的声学特征,一并输入到预训练完成的特征融合模型,进行特征融合,获得特征融合结果,并解码获得发音转换完成的语音。通过所述特征解耦模型和所述特征融合模型,快速实现语音转换,将该语音转换方法,应用到金融客服服务行业,能够为客户提供更加优质和悦耳的音质服务功能。
技术关键词
声学特征
语音转换方法
文本
计算机可读指令
发音
分类准确率
语音解码器
语音特征
语音转换装置
训练集
可读存储介质
数据获取模块
编码
标记
传播算法
批量
解码模块
系统为您推荐了相关专利信息
金融
知识问答方法
空间注意力网络
查询意图
视觉