声音的克隆系统、方法、电子设备及存储介质

正文

推荐专利

申请号：CN202410954532

申请日期：2024-07-16

公开号：CN119132320A

公开日期：2024-12-13

类型：发明专利

摘要

本发明涉及电数字数据处理技术领域，特别涉及一种声音的克隆系统、方法、电子设备及存储介质，其中，系统包括：音频输入模块，用于接收任一声源的参考语音片段；语义提取模块，用于基于参考语音片段，识别参考语音片段的语言学离散语义表示；声纹特征提取模块，用于基于参考语音片段，提取任一声源的声纹特征；声学合成模块，用于将语言学离散语义表示和声纹特征重建为对应的声学频谱；声码器，用于将声学频谱作为输入，以利用参考语音片段输出具有任一声源的音色的语音。由此，解决了相关技术中，声音克隆模型需要一定时长的目标声源语音，不能做到即时克隆，且存在音色泄露现象，导致合成的语音仍含有部分原声源特征等技术问题。

技术关键词

克隆系统语音声纹特征克隆方法长短期记忆神经网络语义特征提取模块电数字数据处理技术声码器声源特征输入模块电子设备计算机程序产品处理器音频算法序列可读存储介质波形

系统为您推荐了相关专利信息

动画视频帧智能选择对话生成系统

对话生成系统角色外观视频帧主题计算机视觉技术

一种多智能体系统

多智能体系统消息中心子系统终端数据

一种基于情绪监测的VR游戏反馈系统

玩家反馈系统情绪变化规律游戏情绪识别技术

一种基于多源数据融合的智慧园区可视化治理平台

应急协同指挥系统集成视频会议可视化单元实时通讯地图定位功能

一种车辆的控制方法、装置、电子设备以及计算机可读存储介质

车辆障碍物车道全局路径规划行驶路径上行驶

声音的克隆系统、方法、电子设备及存储介质

站点导航

APP 下载