基于动态神经网络和特征调制的零样本语音克隆方法

AITNT
正文
推荐专利
基于动态神经网络和特征调制的零样本语音克隆方法
申请号:CN202411631072
申请日期:2024-11-15
公开号:CN119360821B
公开日期:2025-08-29
类型:发明专利
摘要
本发明公开了基于动态神经网络和特征调制的零样本语音克隆方法,所述方法包括说话人风格编码器从参考音频中提取说话人风格向量;基于SGF算法对说话人风格向量进行特征调制,将调制后的说话人风格向量输入生成器;所述生成器基于动态神经网络合成目标说话人音频。所述方法能够在零样本情境下对任一说话人的音频进行克隆,合成流畅自然、相似度高的目标音频。
技术关键词
动态神经网络 风格 克隆方法 编码器 双曲正切函数 序列 样本 Sigmoid函数 MFCC特征 音频 适配器 个性化语音 基准特征 解码器 注意力机制 因子 线性
系统为您推荐了相关专利信息
1
一种基于对比学习的肾癌MRI图像分类方法
图像分类方法 T1加权图像 肾癌 网络 肾脏
2
一种基于深度学习的地形图无标注区域分割方法
区域分割方法 语义 栅格 类别分布概率 节点
3
无线通信装置及其操作方法以及操作系统的方法
多级矢量量化 无线通信装置 机器学习模型 比特流 码字
4
一种基于多视图分析的变电站人员安全距离测量方法
令牌 测量方法 变电站 可见光图像 多视角图像采集
5
一种工业机器人编程教学方法及系统
工业机器人编程 动态知识图谱 知识点 教学方法 学生学习状态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号