一种文本转语音方法、系统、设备和存储介质

正文

推荐专利

申请号：CN202510498356

申请日期：2025-04-21

公开号：CN120412542A

公开日期：2025-08-01

类型：发明专利

摘要

本申请公开了一种文本转语音方法、系统、设备和存储介质，方法包括：将小说文本进行章节处理，其中，每章节文本包括前文本、中间文本和后文本；从每章节文本中的中间文本提取音素、音调、韵律信息和文本内容，并将提取的音素、音调、韵律信息和文本内容进行拼接得到文本向量；获取目标说话人的音色向量，将音色向量与文本向量进行拼接得到目标向量；将目标向量输入到文本转语音模型中进行语音合成，输出小说文本对应的音频。本申请实现了端到端的语音合成，不需要提前给对话旁白、情感、角色打标签，提高了语音合成效率。

技术关键词

文本转语音方法文本转语音系统大语言模型长短期记忆网络存储程序代码编码标识音频可读存储介质处理器声码器打标签语义处理单元存储器计算机数据标记

系统为您推荐了相关专利信息

一种基于强化学习和深度学习的喀斯特流域径流预测方法

径流预测方法长短期记忆网络 DQN算法二维卷积神经网络地下特征

基于强化学习的方案确定方法和装置

深度强化学习模型患者数据深度强化学习技术血液净化系统

一种基于大语言模型的文本知识库分类管理方法

分类管理方法文本大语言模型样本注意力模型

对象推荐方法、装置、电子设备及存储介质

文本对象推荐方法序列大语言模型关键词

机场应急处理方法、装置、设备、存储介质及程序产品

实时信息风险大语言模型计算机执行指令实体

一种文本转语音方法、系统、设备和存储介质

站点导航

APP 下载