音色卡片生成方法、声音克隆方法及3D数字人视频生成方法

正文

推荐专利

申请号：CN202510537531

申请日期：2025-04-27

公开号：CN120612957A

公开日期：2025-09-09

类型：发明专利

摘要

本发明提供一种音色卡片生成方法、声音克隆方法及3D数字人视频生成方法，涉及声音处理技术领域，通过用户提供的目标音频，得到声音特征、频谱特征和语音离散编码序列，并结合用户提供的音色描述信息，生成目标音频对应的音色卡片，可以实现对目标音频的音频特征以及音色描述信息的关联存储，并可以通过音色描述信息实现对不同目标音频的音频特征的标识和区分。用户在需要驱动3D数字人时，不需要每次驱动都录制音频，可以节约用户的时间成本，减少用户的工作量。而且，该目标音频可以选取外界环境影响以及用户本人状态影响较小时进行录制，进而使目标音频符合处理要求，节约驱动3D数字人时耗费的时间，提高用户体验。

技术关键词

卡片生成方法声音克隆方法视频生成方法频谱特征文本声音特征提取语音音色特征序列信噪比信息特征提取模型语句标记卡片生成装置视频生成系统音频特征韵律预测语种识别

系统为您推荐了相关专利信息

一种基于信息检索的病理诊断报告生成方法

诊断报告生成方法信息检索切片文本序列特征

一种智能图像识别辅助的变电站CT相序测量系统

智能图像识别变电站数字式电表阅读器全局特征融合

基于大语言模型的语音生成方法、装置、设备及介质

语音生成方法大语言模型适配器语义特征文本

日志分类模型训练及日志分类方法、装置、产品、设备

日志分类模型文本特征向量日志分类方法标签文本停用词表

文档还原方法、装置、电子设备、存储介质以及程序产品

元素多模态特征游程编码文本行索引

音色卡片生成方法、声音克隆方法及3D数字人视频生成方法

站点导航

APP 下载