一种语音转换方法、存储介质、电子设备及程序产品

正文

推荐专利

申请号：CN202410918937

申请日期：2024-07-09

公开号：CN118675511A

公开日期：2024-09-20

类型：发明专利

摘要

本申请提供一种语音转换方法、存储介质、电子设备及程序产品。涉及人工智能技术领域。本申请在进行语音转换时，可以先确定反应源语音语义内容的多维聚类情况的离散目标标签，使源语音的语义编码特征反应源语音的关键语义信息而不包含音色信息。从而使语音转换模型可以直接基于分离的语义特征与音色特征进行语音转换。基于上述转换过程，本申请创造性地将语音转换模型配置为根据样本语音基于样本自身音色的重建情况训练的机器学习模型。即前述语音转换模型在训练时可以直接基于样本语音进行重建并基于重建情况与实际情况的差异进行参数迭代，以使模型的训练数据无需进行人工标注，整个训练过程可以无监督进行。

技术关键词

语音转换方法编码特征后验特征样本编码器机器学习模型电子设备指令处理器解码器波形文本音色特征可读存储介质人工智能技术标签计算机程序产品语义

系统为您推荐了相关专利信息

身份识别的方法、装置、电子设备及存储介质

生物身份特征值森林模型决策树模型

模型训练方法和病变图像分割方法及装置

图像分割网络模型训练方法图像分割方法编码特征编码器

一种密集通道输电线路故障的智能视觉与状态感知协同隐患监测方法及系统

输电线路故障风险评估模型监测方法单目摄像头动态卷积网络

一种基于服装生产智能制造的MES系统

子模块决策树桩服务器模块阶段样本收集单元

一种针对专业领域的跨模态图文检索方法

适配器图文检索方法节点微调技术专业

一种语音转换方法、存储介质、电子设备及程序产品

站点导航

APP 下载