摘要
本申请提出的语音合成方法、语音合成装置、电子设备及存储介质,涉及人工智能技术领域及金融科技领域。该方法包括:通过初始说话人验证模型中的特征嵌入器对样本语音数据组进行说话人特征提取,得到样本组说话人特征;通过初始说话人验证模型中的特征分类器对样本组说话人特征进行说话人分类,得到样本验证说话人类别,然后对初始说话人验证模型进行参数调整,得到目标说话人验证模型;通过目标说话人验证模型中的特征嵌入器对目标语音数据进行说话人特征提取,得到目标说话人特征;根据目标说话人特征和目标文本特征进行语音生成,得到目标合成语音数据。本申请能够缓解语音数据中的背景噪声带来的不良影响,提高了语音合成的准确性。
技术关键词
语音
样本
噪声特征
验证说话人
背景噪声
噪声识别
说话人识别
数据获取模块
电子设备
分类器
文本
特征提取模块
参数
人工智能技术
强度
处理器
可读存储介质
存储器
系统为您推荐了相关专利信息
头戴式计算机
噪声频谱
梅尔频率倒谱系数
噪声源
降噪方法
茶叶生产线
智能检测方法
二维图像数据
样本
三维图像数据
历史运行数据
指标
评价方法
初始聚类中心
k均值聚类算法
深度强化学习
飞行器
参数整定方法
扩张状态观测器
仿真模型
光谱特征参数
预测网络模型
多光谱
可见光图像
地面控制点