一种文本到语音生成方法

正文

推荐专利

一种文本到语音生成方法

申请号：CN202411539820

申请日期：2024-10-31

公开号：CN119049447B

公开日期：2025-01-10

类型：发明专利

摘要

本发明公开了一种文本到语音生成方法，属于语音生成技术领域，能够解决现有文本到语音系统语音合成效率低、且依赖对齐信息的问题。所述方法包括：S1、获取参考语音的自监督特征，并对自监督特征进行离散化处理，得到参考语义标记序列；S2、根据文本标记序列和参考语义标记序列，得到目标语义标记序列；S3、对目标语义标记序列进行预测，得到多层声学标记序列，并根据多层声学标记序列生成目标语音。本发明用于生成目标语音。

技术关键词

语义语音生成方法标记序列编解码器文本语音生成技术神经网络模型语音系统编码器模块

系统为您推荐了相关专利信息

一种基于用电场景的配电系统综合效益计算方法及系统

效益计算方法配电系统功率稳定场景多时间尺度

一种面向大模型生成内容信息安全强化的系统及方法

编辑样本知识蒸馏技术细粒度分类数据

一种基于多模态的指令处理方法及装置

指令上下文特征意图多模态大语言模型

一种基于工业互联网的智能语音识别方法

智能语音识别方法工业互联网生成特征向量麦克风阵列多模态

一种电表生产质量追溯系统及方法

数据采集子系统时域特征提取频域特征提取分析子系统语义分割算法

一种文本到语音生成方法

站点导航

APP 下载