音色卡片生成方法、声音克隆方法及3D数字人视频生成方法

AITNT
正文
推荐专利
音色卡片生成方法、声音克隆方法及3D数字人视频生成方法
申请号:CN202510537531
申请日期:2025-04-27
公开号:CN120612957A
公开日期:2025-09-09
类型:发明专利
摘要
本发明提供一种音色卡片生成方法、声音克隆方法及3D数字人视频生成方法,涉及声音处理技术领域,通过用户提供的目标音频,得到声音特征、频谱特征和语音离散编码序列,并结合用户提供的音色描述信息,生成目标音频对应的音色卡片,可以实现对目标音频的音频特征以及音色描述信息的关联存储,并可以通过音色描述信息实现对不同目标音频的音频特征的标识和区分。用户在需要驱动3D数字人时,不需要每次驱动都录制音频,可以节约用户的时间成本,减少用户的工作量。而且,该目标音频可以选取外界环境影响以及用户本人状态影响较小时进行录制,进而使目标音频符合处理要求,节约驱动3D数字人时耗费的时间,提高用户体验。
技术关键词
卡片生成方法 声音克隆方法 视频生成方法 频谱特征 文本 声音特征提取 语音 音色特征 序列 信噪比信息 特征提取模型 语句 标记 卡片生成装置 视频生成系统 音频特征 韵律预测 语种识别
系统为您推荐了相关专利信息
1
一种基于信息检索的病理诊断报告生成方法
诊断报告生成方法 信息检索 切片 文本 序列特征
2
一种智能图像识别辅助的变电站CT相序测量系统
智能图像识别 变电站 数字式电表 阅读器 全局特征融合
3
基于大语言模型的语音生成方法、装置、设备及介质
语音生成方法 大语言模型 适配器 语义特征 文本
4
日志分类模型训练及日志分类方法、装置、产品、设备
日志分类模型 文本特征向量 日志分类方法 标签文本 停用词表
5
文档还原方法、装置、电子设备、存储介质以及程序产品
元素 多模态特征 游程编码 文本行 索引
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号