可控零样本语音转换方法、装置、设备及介质

正文

推荐专利

申请号：CN202511218872

申请日期：2025-08-28

公开号：CN121034280A

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及语音语义技术领域，可应用于金融科技、医疗健康等业务系统平台中，揭露了一种可控零样本语音转换方法、装置、设备及介质，所述方法包括：对未标注语音数据进行自监督语音学习，得到自监督语音表示，提取自监督语音表示的内容特征向量和韵律风格向量，并转化为离散内容令牌和离散韵律令牌，对离散韵律令牌进行掩码生成，得到目标韵律令牌，获取目标用户的参考语音，提取参考语音中的用户风格嵌入，对离散内容令牌、目标韵律令牌和用户风格嵌入进行流匹配，生成目标梅尔频谱图，对目标梅尔频谱图进行语音波形重建与优化，得到零样本语音转换结果。本发明在无标注语音数据条件下，实现个性化、高保真、风格一致的零样本语音转换问题。

技术关键词

语音转换方法令牌风格波形样本音色特征语音语义技术语音转换装置数据高频特征生成语音医疗健康编码器声码器电子设备处理器通信业务系统模块

系统为您推荐了相关专利信息

基于双流解码器模型的风电功率预测方法和系统

解码器模型数据解码器风电功率预测系统风电功率预测方法气象

一种算力中心分级功耗概率预测方法及装置

预测误差概率密度估计方法功耗功率概率预测方法

功耗的获取方法、计算设备及计算机存储介质

功耗查找表神经网络模型元器件数据

一种剩余电流突变检测方法、装置及存储介质

突变检测方法剩余电流互感器指数平滑法智能电能表有效值

一种巡视器多光照仿真双目影像样本构建方法、系统、设备及介质

三维地形数据双目相机仿真环境影像光照

可控零样本语音转换方法、装置、设备及介质

站点导航

APP 下载