基于无监督特征的声音转换方法、电子设备和存储介质

正文

推荐专利

申请号：CN202510340603

申请日期：2025-03-21

公开号：CN120126493A

公开日期：2025-06-10

类型：发明专利

摘要

本发明实施例提供一种基于无监督特征的声音转换方法、系统、电子设备和存储介质。该方法包括：将源说话人的第一音频以及目标说话人的第二音频输入至基于无监督特征的声音转换模型；基于自监督语音模型提取源说话人的第一音频中的无监督特征；通过声纹提取模型来提取第二音频中包括音色及语调的x‑vector特征；利用转换模型将无监督特征映射到目标说话人的目标语音特征域，得到音色转换特征；将x‑vector特征作为个性化的辅助特征对音色转换特征在声码器中进行特征重建，得到目标说话人的转换音频。本发明实施例基于无监督特征提取的声音转换模型能够实现高效的声音转换并且能提高模型的泛化能力，取得更优异的声音转换效果。

技术关键词

音频声音转换方法声码器无监督特征提取语音特征深度神经网络计算机程序产品多语种语音电子设备信噪比数据文本处理器通信指令输入模块集群

系统为您推荐了相关专利信息

基频检测方法、装置、设备及存储介质

基频检测方法谐波信号基频检测算法数据处理模块

一种基于软件无线电技术的集成化业务终端及其工作方法

软件无线电技术接口模块业务终端 ASIC芯片处理器系统

一种基于智能硬件的手机文件备份方法及系统

移动终端设备智能硬件文件备份方法云服务设备设备标识信息

一种结合文本纠错的流式语音识别方法

语音识别系统流式语音识别方法文本序列错误检测器

一种面向海洋生物的声音提取增强方法、系统、设备及介质

噪声数据智能信息处理技术生物多样性研究音频重建原始数据

基于无监督特征的声音转换方法、电子设备和存储介质

站点导航

APP 下载