基于动态神经网络和特征调制的零样本语音克隆方法

正文

推荐专利

申请号：CN202411631072

申请日期：2024-11-15

公开号：CN119360821B

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了基于动态神经网络和特征调制的零样本语音克隆方法，所述方法包括说话人风格编码器从参考音频中提取说话人风格向量；基于SGF算法对说话人风格向量进行特征调制，将调制后的说话人风格向量输入生成器；所述生成器基于动态神经网络合成目标说话人音频。所述方法能够在零样本情境下对任一说话人的音频进行克隆，合成流畅自然、相似度高的目标音频。

技术关键词

动态神经网络风格克隆方法编码器双曲正切函数序列样本 Sigmoid函数 MFCC特征音频适配器个性化语音基准特征解码器注意力机制因子线性

系统为您推荐了相关专利信息

一种基于对比学习的肾癌MRI图像分类方法

图像分类方法 T1加权图像肾癌网络肾脏

一种基于深度学习的地形图无标注区域分割方法

区域分割方法语义栅格类别分布概率节点

无线通信装置及其操作方法以及操作系统的方法

多级矢量量化无线通信装置机器学习模型比特流码字

一种基于多视图分析的变电站人员安全距离测量方法

令牌测量方法变电站可见光图像多视角图像采集

一种工业机器人编程教学方法及系统

工业机器人编程动态知识图谱知识点教学方法学生学习状态

基于动态神经网络和特征调制的零样本语音克隆方法

站点导航

APP 下载