语音合成方法及装置

正文

推荐专利

语音合成方法及装置

申请号：CN202510764438

申请日期：2025-06-09

公开号：CN120526754A

公开日期：2025-08-22

类型：发明专利

摘要

本说明书实施例提供一种语音合成方法，包括：获取长参考音频和对应的参考文本。将长参考音频和参考文本输入语音合成系统进行目标处理，该语音合成系统包括，对齐模块和编码模块。上述目标处理包括：利用对齐模块，将长参考音频和参考文本在时间维度上对齐，得到参考文本对应的第一音素序列中各参考音素对应的音频片段。利用编码模块，基于各参考音素及其对应的音频片段，确定预设的词表中各个音素对应的各发音表征。从各个音素对应的各发音表征中，确定出目标文本对应的第二音素序列中各目标音素对应的各目标发音表征。基于各目标音素对应的各目标发音表征，确定目标文本对应的目标音频。

技术关键词

文本发音音频对齐模块编码模块语音序列声码器扩展算法处理单元编解码器网络计算机可读存储介质存储器处理器场景

系统为您推荐了相关专利信息

图像编码方法、装置、存储介质及电子设备

切片水印像素图像编码器图像块

一种非结构化数据的检索方法、装置、设备及可读介质

数据检索系统网关检索方法存储库循环神经网络模型

基于人工智能的快速绘画猜词系统

图像生成单元特征提取单元游戏个性化控制模块记录单元

显示方法、装置及程序产品

三维建筑模型显示信息地图界面兴趣点三维建筑物模型

检测方法、装置及系统

对象工位图像获取单元员工节点

语音合成方法及装置

站点导航

APP 下载