基于文本的语音合成方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411658753

申请日期：2024-11-19

公开号：CN119400150B

公开日期：2025-10-10

类型：发明专利

摘要

本公开提供了一种基于文本的语音合成方法、装置、设备及存储介质，涉及人工智能领域，尤其涉及文本转语音领域，可应用于智能客服、语音阅读助手、语音内容创作、语音教育培训等领域。具体实现方案为：获取目标文本和参考音频；其中，所述目标文本是待合成语音的文本，所述参考音频为预设音色的音频；对所述目标文本进行特征提取处理，得到所述目标文本的文本特征向量；其中，所述文本特征向量表征文本的语义特征和韵律特征；根据所述文本特征向量和所述参考音频，得到所述目标文本对应的目标音频；其中，所述目标音频的音色与所述参考音频的音色一致。本公开不需要对文本转音素的方法进行维护，通过提取语义特征和韵律特征，提高语音的合成精度。

技术关键词

文本特征向量音频编码韵律特征语义特征语音编码器量化器子模块特征提取单元文本编码器预训练模型特征提取模块数据获取单元处理器智能客服计算机程序产品

系统为您推荐了相关专利信息

基于多源数据融合的信贷业务风控决策方法、装置、设备和介质

风控决策方法语义特征融合置信度图谱实体

面向图书馆数字资源的用户信息分析系统

书籍面向图书馆信息分析系统感兴趣特征提取单元

一种基于双分支网络结构的裂缝检测方法

路面裂缝图像裂缝检测方法网络结构路面裂缝检测注意力

一种侦察无人机的信号处理方法及系统

中频信号侦察无人机信号处理方法因子波形特征提取

文创产品定制智能化服务系统及方法

智能化服务方法原型跨模态智能化服务系统矩阵

基于文本的语音合成方法、装置、设备及存储介质

站点导航

APP 下载