摘要
本申请公开了一种语音增强方法、装置、存储介质及设备,该方法包括:首先获取目标用户的录音数据;并利用录音数据训练得到语音转换模型和第一语音合成模型;其中,目标用户的录音数据包括文本数据及对应的语音数据,然后利用语音转换模型构造第一文本语音数据对;并利用第一语音合成模型构造第二文本语音数据对;接着对第一文本语音数据对和第二文本语音数据对进行质量筛选,得到筛选后的文本语音数据对;并利用筛选后的文本语音数据对和目标用户的录音数据构成增强后的语音数据。从而能够有效提高增强后的语音数据的质量,进而在利用增强后的语音数据再次训练得到语音合成模型后,可以有效提高模型的语音合成效果。
技术关键词
数据
声纹特征
一致性检测
文本识别
语音识别模型
无监督聚类
可读存储介质
终端设备
处理器
存储器
指令
样本
计算机
程序
指标