一种语音转换方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种语音转换方法、装置、电子设备及存储介质
申请号:CN202511040890
申请日期:2025-07-28
公开号:CN120727020A
公开日期:2025-09-30
类型:发明专利
摘要
本申请提供了一种语音转换方法、装置、电子设备及存储介质,包括:对源音频进行内容特征以及基频特征的提取,对目标音频进行说话人特征的提取;将所述内容特征、所述基频特征以及所述说话人特征输入至语音转换模型之中进行联合建模处理、线性映射处理以及波形重建处理,生成语音波形;基于所述语音转换模型中的声码器对所述语音波形进行一维深度分离卷积处理以及多感受野融合处理,生成转换后的语音音频;其中,所述转换后的语音音频表现为将所述源音频的说话风格替换为所述目标音频的说话人风格。利用语音转换模型进行语音转换提高了跨语种语音转换的音色一致性与语义保留能力,提升了重建语音的自然度与清晰度。
技术关键词
语音转换方法 音频 样本 神经网络模型 声码器 生成语音 波形 语音转换装置 线性 解码器 时域特征 机器可读指令 风格 交叉注意力机制 多尺度 电子设备 编码器 处理器 可读存储介质
系统为您推荐了相关专利信息
1
一种停车场车型和车位的视觉AI推送方法及其系统
车辆识别模型 样本 图像 推送方法 停车场
2
基于机器视觉的苹果酸甜度检测方法和装置
苹果外观 机器学习模型 支持向量回归模型 灰度共生矩阵 轮廓图像
3
一种计算机断层成像重建方法及相关装置
计算机断层成像 数据 计算机可读指令 电子设备 去噪模型
4
一种直流充电桩计量检定方法、系统、设备及储存介质
计量检定方法 高斯混合模型 多层感知机 直流充电桩 模式
5
基于不确定性增强和主动学习优化的医学图像标注方法
医学图像标注方法 标注医学图像 分支 样本 预训练模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号