一种基于音色解耦的零样本语音转换方法

正文

推荐专利

一种基于音色解耦的零样本语音转换方法

申请号：CN202510674116

申请日期：2025-05-23

公开号：CN120544586A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开了一种基于音色解耦的零样本语音转换方法，包括：分别获取待转换语音和目标说话人的参考语音；构建零样本语音转换模型；将待转换语音与目标说话人的参考语音共同输入零样本语音转换模型中进行处理，输出转换结果；零样本语音转换模型包括内容解耦模块、音色解耦与提取模块、语音转换与重构模块；通过内容解耦模块生成音色随机变化但语义内容保持不变的语音，通过音色解耦与提取模块提取目标说话人参考语音中的音色并强化音色表征，基于语音转换与重构模块生成音色转换后的语音。本发明实现了仅使用任意目标说话人的一条语音作为参考，将源语音中的声音风格特征转换为目标说话人，同时保持语义内容与源语音一致。

技术关键词

语音转换方法重构模块说话人身份信息嵌入特征样本音色特征编码器训练语音模型语义卷积模块融合特征多尺寸输入多尺度对抗性分类器注意力数据

系统为您推荐了相关专利信息

锂离子电池充放电异常的预警方法及模型训练方法

锂离子电池充放电样本预警方法模型训练方法电流

一种基于机器学习的含可信度地层孔隙压力随钻更新方法

地层孔隙压力更新方法 Pearson相关系数录井数据滤波方法

一种用于脊柱侧弯诊断的数字诊疗智能分析系统

智能分析系统数据采集模块人机交互模块识别模块诊断模块

一种深度学习的幕墙清洁参数优化控制方法及系统

作业参数清洁一体机参数优化控制方法图像采集单元喷涂单元

基于指令条件压缩的视频理解方法、系统、设备及介质

视频理解方法局部视觉特征指令注意力机制大语言模型

一种基于音色解耦的零样本语音转换方法

站点导航

APP 下载