摘要
本申请公开了一种文本转语音方法、系统、设备和存储介质,方法包括:将小说文本进行章节处理,其中,每章节文本包括前文本、中间文本和后文本;从每章节文本中的中间文本提取音素、音调、韵律信息和文本内容,并将提取的音素、音调、韵律信息和文本内容进行拼接得到文本向量;获取目标说话人的音色向量,将音色向量与文本向量进行拼接得到目标向量;将目标向量输入到文本转语音模型中进行语音合成,输出小说文本对应的音频。本申请实现了端到端的语音合成,不需要提前给对话旁白、情感、角色打标签,提高了语音合成效率。
技术关键词
文本转语音方法
文本转语音系统
大语言模型
长短期记忆网络
存储程序代码
编码
标识
音频
可读存储介质
处理器
声码器
打标签
语义
处理单元
存储器
计算机
数据
标记
系统为您推荐了相关专利信息
径流预测方法
长短期记忆网络
DQN算法
二维卷积神经网络
地下特征
深度强化学习模型
患者
数据
深度强化学习技术
血液净化系统