一种语音合成方法、装置、电子设备及可读存储介质

正文

推荐专利

申请号：CN202510593144

申请日期：2025-05-09

公开号：CN120108381A

公开日期：2025-06-06

类型：发明专利

摘要

本发明涉及语音合成技术领域，尤其涉及一种语音合成方法、装置、电子设备及可读存储介质，获取待合成语音的目标文本和一个随机采样噪声；将目标文本输入训练好的目标语音合成模型的文本特征提取模块，确定出目标文本的文本特征；目标语音合成模型还包括文本特征编码模块和语音生成模块；将文本特征和随机采样噪声输入文本特征编码模块，确定出文本特征对应的音频特征的潜在变量；将潜在变量输入语音生成模块，生成潜在变量对应的音频信号，并确定为与目标文本相匹配的目标合成语音。这样，通过训练好的语音合成模型，可以直接将目标文本的文本特征对应的音频特征的潜在变量转换为与目标文本相匹配的目标合成语音，提高了语音合成的合成效率。

技术关键词

文本语音音频特征编码模块特征提取模块样本变量数据转换模块音频编码数据对齐模块语义特征提取机器可读指令噪声电子设备矩阵重构时序

系统为您推荐了相关专利信息

一种视频数据处理方法及装置

预训练模型视频数据处理方法跨模态时间段样本

一种卫浴装修方案智能生成方法与装置

智能生成方法室内空间关键词提取模型客户文本

一种基于大语言模型的能源决策生成方法及系统

能源大语言模型决策生成方法强化学习算法数据

数据处理方法、平台、计算设备以及存储介质

邮件数据处理方法项目客户端订单

一种基于电磁波的异常电弧检测方法及系统

电弧检测方法电弧检测模型电弧检测系统电磁波传感器数据

一种语音合成方法、装置、电子设备及可读存储介质

站点导航

APP 下载