基于动态适配的个性化声音克隆方法、装置、设备及介质

正文

推荐专利

申请号：CN202511100207

申请日期：2025-08-07

公开号：CN120748363A

公开日期：2025-10-03

类型：发明专利

摘要

本申请公开了基于动态适配的个性化声音克隆方法、装置、设备及介质，涉及语音合成技术领域，包括：基于预设深度神经网络对原始语音样本进行特征提取，以获取多模态语音特征，并进行融合编码，生成声学表征模型；确定待合成文本内容和目标场景模板，并从预设场景模板库中提取目标声学参数，以基于目标声学参数和声学表征模型，针对待合成文本内容进行声学参数调整，生成目标克隆语音；利用多语言语音编码器提取出与语言无关的声学特征，并确定待迁移的目标语言，以及生成对应的文本语料库；基于文本语料库对目标克隆语音进行音素映射与对齐操作，并通过预设生成对抗网络和声学特征进行目标克隆语音的跨语言迁移操作，生成目标语言语音。

技术关键词

声音克隆方法多模态语音声学特征节奏特征文本生成对抗网络深度神经网络声纹特征克隆系统样本模板动态时间规整算法语音编码器场景参数生成语音语音特征分割算法

系统为您推荐了相关专利信息

一种基于大语言模型知识融合的多选式问答方法

大语言模型预训练语言模型问答方法文本编码器生成方法

一种基于动态分块及选择的长文本阅读理解方法

阅读理解方法文本分块方法语义序列

一种对病历图像的内容进行识别的方法及装置

病历图像文本光学字符识别语义

一种基于多视图集成学习的呼吸音数据分类系统

数据分类系统萤火虫算法时间序列特征特征提取模块分类器

网络故障运维方法、装置、设备及存储介质

应用服务调用文本语句运维知识库运维方法

基于动态适配的个性化声音克隆方法、装置、设备及介质

站点导航

APP 下载