一种语音转换方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202511040890

申请日期：2025-07-28

公开号：CN120727020A

公开日期：2025-09-30

类型：发明专利

摘要

本申请提供了一种语音转换方法、装置、电子设备及存储介质，包括：对源音频进行内容特征以及基频特征的提取，对目标音频进行说话人特征的提取；将所述内容特征、所述基频特征以及所述说话人特征输入至语音转换模型之中进行联合建模处理、线性映射处理以及波形重建处理，生成语音波形；基于所述语音转换模型中的声码器对所述语音波形进行一维深度分离卷积处理以及多感受野融合处理，生成转换后的语音音频；其中，所述转换后的语音音频表现为将所述源音频的说话风格替换为所述目标音频的说话人风格。利用语音转换模型进行语音转换提高了跨语种语音转换的音色一致性与语义保留能力，提升了重建语音的自然度与清晰度。

技术关键词

语音转换方法音频样本神经网络模型声码器生成语音波形语音转换装置线性解码器时域特征机器可读指令风格交叉注意力机制多尺度电子设备编码器处理器可读存储介质

系统为您推荐了相关专利信息

一种停车场车型和车位的视觉AI推送方法及其系统

车辆识别模型样本图像推送方法停车场

基于机器视觉的苹果酸甜度检测方法和装置

苹果外观机器学习模型支持向量回归模型灰度共生矩阵轮廓图像

一种计算机断层成像重建方法及相关装置

计算机断层成像数据计算机可读指令电子设备去噪模型

一种直流充电桩计量检定方法、系统、设备及储存介质

计量检定方法高斯混合模型多层感知机直流充电桩模式

基于不确定性增强和主动学习优化的医学图像标注方法

医学图像标注方法标注医学图像分支样本预训练模型

一种语音转换方法、装置、电子设备及存储介质

站点导航

APP 下载