摘要
本申请实施例提供了一种语音合成方法、语音合成装置、电子设备及存储介质,属于人工智能技术领域,适用于金融科技领域和数字医疗领域。该方法包括:获取原始语音,对原始语音进行语音分割,得到候选语音段以及候选语音段的说话人标识,根据说话人标识对候选语音段进行合并,得到参考语音段,对参考语音段进行筛选,得到目标语音段,对目标语音段进行语音识别,得到目标语音段的目标文本,根据目标语音段和目标文本构建语音文本对,并根据语音文本对对原始语音合成模型进行模型更新,得到目标语音合成模型,通过目标语音合成模型对预设的参考文本进行语音合成,能够提高语音合成的质量。
技术关键词
文本
模型更新
频谱特征
字符
语音特征
背景噪声
语义特征
电子设备
标识
语音识别模块
可读存储介质
人工智能技术
处理器
存储器
计算机
金融
信号
系统为您推荐了相关专利信息
功能模块
转移概率矩阵
交互方法
向量空间模型
识别用户意图
知识图谱构建方法
检修方法
三元组
置信度算法
实体