一种基于音色解耦的零样本语音转换方法

AITNT
正文
推荐专利
一种基于音色解耦的零样本语音转换方法
申请号:CN202510674116
申请日期:2025-05-23
公开号:CN120544586A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了一种基于音色解耦的零样本语音转换方法,包括:分别获取待转换语音和目标说话人的参考语音;构建零样本语音转换模型;将待转换语音与目标说话人的参考语音共同输入零样本语音转换模型中进行处理,输出转换结果;零样本语音转换模型包括内容解耦模块、音色解耦与提取模块、语音转换与重构模块;通过内容解耦模块生成音色随机变化但语义内容保持不变的语音,通过音色解耦与提取模块提取目标说话人参考语音中的音色并强化音色表征,基于语音转换与重构模块生成音色转换后的语音。本发明实现了仅使用任意目标说话人的一条语音作为参考,将源语音中的声音风格特征转换为目标说话人,同时保持语义内容与源语音一致。
技术关键词
语音转换方法 重构模块 说话人身份信息 嵌入特征 样本 音色特征 编码器 训练语音模型 语义 卷积模块 融合特征 多尺寸 输入多尺度 对抗性 分类器 注意力 数据
系统为您推荐了相关专利信息
1
锂离子电池充放电异常的预警方法及模型训练方法
锂离子电池充放电 样本 预警方法 模型训练方法 电流
2
一种基于机器学习的含可信度地层孔隙压力随钻更新方法
地层孔隙压力 更新方法 Pearson相关系数 录井数据 滤波方法
3
一种用于脊柱侧弯诊断的数字诊疗智能分析系统
智能分析系统 数据采集模块 人机交互模块 识别模块 诊断模块
4
一种深度学习的幕墙清洁参数优化控制方法及系统
作业参数 清洁一体机 参数优化控制方法 图像采集单元 喷涂单元
5
基于指令条件压缩的视频理解方法、系统、设备及介质
视频理解方法 局部视觉特征 指令 注意力机制 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号