用于语音合成的方法、装置、设备和可读介质

正文

推荐专利

申请号：CN202411008685

申请日期：2024-07-25

公开号：CN118737122A

公开日期：2024-10-01

类型：发明专利

摘要

本公开的实施例提供了一种用于语音合成的方法、装置、设备和可读介质。根据本公开的实施例，利用预测器模型对目标文本对应的音素嵌入序列执行音素预测，以获取预测音素序列。基于语音生成任务的类型来确定对参考音频的量化声学特征的遮蔽处理，以获取遮蔽声学特征。利用编码器模型，对遮蔽声学特征执行编码操作，以获取遮蔽特征码。利用解码器模型，基于遮蔽特征码和预测音素序列执行解码操作，以获取第一预测特征码。至少基于第一预测特征码生成目标文本对应的语音波形。以此方式，实现零样本语音合成。同时使模型能够同时实现语音克隆和语音编辑任务。

技术关键词

声学特征预测特征语音序列解码器模型文本音频波形编辑编码器处理单元语义特征提取融合特征双向变换器遮蔽模块样本解码模块

系统为您推荐了相关专利信息

纤溶酶抑制剂NKI10在制备防治过度炎症反应药物中的应用

纤溶酶抑制剂细胞炎症模型动物炎症生物医药技术序列

基于多帧无水尺抗水印水位检测方法

水位检测方法水尺水印图像滤波器系数更新

一种基于openAI的司机判罚系统

司机行驶路线数据 LSTM模型动态变化模型分析模块

一种基于自回归式模型的药物设计方法

药物设计方法配体分词算法文本数据

一种基于动态资源分配多任务差分进化算法的车辆路径优化方法

客户车辆路径优化方法订单动态资源分配站点

用于语音合成的方法、装置、设备和可读介质

站点导航

APP 下载