一种文本转语音方法、系统、设备和存储介质

AITNT
正文
推荐专利
一种文本转语音方法、系统、设备和存储介质
申请号:CN202510498356
申请日期:2025-04-21
公开号:CN120412542A
公开日期:2025-08-01
类型:发明专利
摘要
本申请公开了一种文本转语音方法、系统、设备和存储介质,方法包括:将小说文本进行章节处理,其中,每章节文本包括前文本、中间文本和后文本;从每章节文本中的中间文本提取音素、音调、韵律信息和文本内容,并将提取的音素、音调、韵律信息和文本内容进行拼接得到文本向量;获取目标说话人的音色向量,将音色向量与文本向量进行拼接得到目标向量;将目标向量输入到文本转语音模型中进行语音合成,输出小说文本对应的音频。本申请实现了端到端的语音合成,不需要提前给对话旁白、情感、角色打标签,提高了语音合成效率。
技术关键词
文本转语音方法 文本转语音系统 大语言模型 长短期记忆网络 存储程序代码 编码 标识 音频 可读存储介质 处理器 声码器 打标签 语义 处理单元 存储器 计算机 数据 标记
系统为您推荐了相关专利信息
1
一种基于强化学习和深度学习的喀斯特流域径流预测方法
径流预测方法 长短期记忆网络 DQN算法 二维卷积神经网络 地下特征
2
基于强化学习的方案确定方法和装置
深度强化学习模型 患者 数据 深度强化学习技术 血液净化系统
3
一种基于大语言模型的文本知识库分类管理方法
分类管理方法 文本 大语言模型 样本 注意力模型
4
对象推荐方法、装置、电子设备及存储介质
文本 对象推荐方法 序列 大语言模型 关键词
5
机场应急处理方法、装置、设备、存储介质及程序产品
实时信息 风险 大语言模型 计算机执行指令 实体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号