基于动态适配的个性化声音克隆方法、装置、设备及介质

AITNT
正文
推荐专利
基于动态适配的个性化声音克隆方法、装置、设备及介质
申请号:CN202511100207
申请日期:2025-08-07
公开号:CN120748363A
公开日期:2025-10-03
类型:发明专利
摘要
本申请公开了基于动态适配的个性化声音克隆方法、装置、设备及介质,涉及语音合成技术领域,包括:基于预设深度神经网络对原始语音样本进行特征提取,以获取多模态语音特征,并进行融合编码,生成声学表征模型;确定待合成文本内容和目标场景模板,并从预设场景模板库中提取目标声学参数,以基于目标声学参数和声学表征模型,针对待合成文本内容进行声学参数调整,生成目标克隆语音;利用多语言语音编码器提取出与语言无关的声学特征,并确定待迁移的目标语言,以及生成对应的文本语料库;基于文本语料库对目标克隆语音进行音素映射与对齐操作,并通过预设生成对抗网络和声学特征进行目标克隆语音的跨语言迁移操作,生成目标语言语音。
技术关键词
声音克隆方法 多模态语音 声学特征 节奏特征 文本 生成对抗网络 深度神经网络 声纹特征 克隆系统 样本 模板 动态时间规整算法 语音编码器 场景 参数 生成语音 语音特征 分割算法
系统为您推荐了相关专利信息
1
一种基于大语言模型知识融合的多选式问答方法
大语言模型 预训练语言模型 问答方法 文本编码器 生成方法
2
一种基于动态分块及选择的长文本阅读理解方法
阅读理解方法 文本 分块方法 语义 序列
3
一种对病历图像的内容进行识别的方法及装置
病历 图像 文本 光学字符识别 语义
4
一种基于多视图集成学习的呼吸音数据分类系统
数据分类系统 萤火虫算法 时间序列特征 特征提取模块 分类器
5
网络故障运维方法、装置、设备及存储介质
应用服务调用 文本 语句 运维知识库 运维方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号