语音合成方法、语音合成装置、电子设备及存储介质

正文

推荐专利

申请号：CN202510354047

申请日期：2025-03-24

公开号：CN120220640A

公开日期：2025-06-27

类型：发明专利

摘要

本申请提出的语音合成方法、语音合成装置、电子设备及存储介质，涉及人工智能技术领域，适用于金融科技领域及医疗健康领域。该方法包括：对目标语音数据进行音色提取，得到目标音色特征；对源语音数据进行特征提取，得到源语言内容特征；对源语音数据进行风格提取，得到源初始风格特征；通过风格编码器对源初始风格特征进行风格编码，得到源增强风格特征；通过风格编码器对源增强风格特征、源语言内容特征以及目标音色特征进行注意力编码，得到目的编码语音特征；对源增强风格特征、目的编码语音特征以及目标音色特征进行语音解码，得到目标合成语音数据。本申请能够提高语音合成的音色一致性，且提高语音合成的自然性。

技术关键词

风格音色特征编码器样本语音特征数据语音编码注意力参数标签电子设备编码模块非线性解码特征提取模块人工智能技术医疗健康

系统为您推荐了相关专利信息

一种多源异构数据语义对齐方法、装置、设备及介质

多源异构数据异构数据语义语义特征对齐方法无监督特征提取

基于车载血压计实现患者状态的智能监测方法及系统

智能监测方法方向盘血压计红外照射患者

一种基于网络模型的储能电站的电池组故障诊断系统

电池故障诊断储能电站电池单体电池组电池运行状态

闸机故障预测方法、装置及计算设备

故障检测模型故障预测方法闸机参数计算机可执行指令

基于运行可靠性智能评估模型的评估方法及相关装置

智能评估模型负荷神经网络参数电力系统构建鲁棒

语音合成方法、语音合成装置、电子设备及存储介质

站点导航

APP 下载