一种模型训练方法、音频生成方法、电子设备及存储介质

正文

推荐专利

申请号：CN202411712524

申请日期：2024-11-27

公开号：CN119541449A

公开日期：2025-02-28

类型：发明专利

摘要

本发明公开了一种模型训练方法、音频生成方法、电子设备及存储介质。该方法包括：从当前训练数据集中获取一组训练数据，训练数据包括源音频数据及其对应的文本数据，源音频数据包括原始声学特征；将原始声学特征和文本数据输入生成网络，生成目标音频数据；将目标音频数据和源音频数据输入鉴别网络，确定损失函数；若满足训练结束条件，则将生成网络作为音频生成模型的一个与当前声源匹配的子模型；若不满足训练结束条件，则根据损失函数，调节生成网络和鉴别网络的参数，并从当前训练数据集中重新获取一组训练数据，返回执行将原始声学特征和文本数据输入生成网络，生成目标音频数据的步骤。本方案能够生成多种音色且贴近自然语言的音频。

技术关键词

模型训练方法矢量量化声学特征音频生成方法数据量化器文本网络码字均值聚类算法电子设备字典可读存储介质计算机参数处理器通信自然语言编码

一种模型训练方法、音频生成方法、电子设备及存储介质

站点导航

APP 下载