个性化文本转语音的方法、系统及相关设备

正文

推荐专利

个性化文本转语音的方法、系统及相关设备

申请号：CN202510771127

申请日期：2025-06-10

公开号：CN120412538A

公开日期：2025-08-01

类型：发明专利

摘要

本发明提供了一种个性化文本转语音的方法、系统及相关设备，方法包括使用非标单说话人的文本/音频语料对深度学习模型进行训练，获得非标文本转语音模型；获取定制音色的单说话人参考音频和待转换的目标文本；将所述目标文本输入所述非标文本转语音模型中，获得所述目标文本的声谱表示；利用声纹编码器从所述单说话人参考音频中提取得到目标说话人的音色嵌入向量；将所述声谱表示和所述音色嵌入向量进行融合后输入神经声码器中，获得个性化语音波形。本发明的方法只需通过单说话人的非标语言数据即可实现音色迁移个性化音频的合成，降低了方案实现难度，能够更好的满足用户需求。

技术关键词

文本深度学习模型声谱个性化语音音频音色特征声码器编码器多层注意力机制声学特征波形生成对抗网络序列模型训练模块可读存储介质神经网络模型存储器数据获取模块处理器

系统为您推荐了相关专利信息

人岗匹配自适应优化系统及其方法

技能评估决策能力知识图谱智能化管理技术指令

一种动态骨骼识别方法、系统、存储介质及电子设备

骨骼识别方法骨骼模型多模态深度学习模型动作特征

一种基于多模态预训练模型的类增量图像分类方法及系统

图像分类方法预训练模型文本编码器图像编码器多模态

一种功率控制方法和设备

功率控制方法终端设备信令交互数据模式语音提示信息

一种信息处理方法、装置及电子设备

控件信息处理方法界面页面关系

个性化文本转语音的方法、系统及相关设备

站点导航

APP 下载