语音合成模型训练方法以及语音合成方法

AITNT
正文
推荐专利
语音合成模型训练方法以及语音合成方法
申请号:CN202410986607
申请日期:2024-07-22
公开号:CN118865943A
公开日期:2024-10-29
类型:发明专利
摘要
本公开关于语音合成模型训练方法以及语音合成方法,该语音合成模型训练方法包括获取样本文本以及所述样本文本对应的样本语音;将所述样本语音输入语音处理模型中的编码器进行语音编码,得到样本语音表征;将所述样本文本输入文本模型进行文本特征提取,得到样本文本表征,所述样本文本表征和所述样本语音表征具备相同长度;基于所述样本文本表征和所述样本语音表征训练初始模型,得到语音转换模型;基于所述文本模型、所述语音转换模型和所述语音处理模型中的解码器,得到语音合成模型;其中,所述文本模型和所述语音处理模型均为经过预训练的模型。本公开提升了语音合成模型的训练速度,降低了训练语音合成模型所需成本。
技术关键词
文本 样本 模型训练方法 噪声预测 语音编码 解码器 训练数据处理 计算机程序产品 编码特征 模型训练装置 编码器 电子设备 处理器 可读存储介质 数据获取模块 线性
系统为您推荐了相关专利信息
1
一种基于合成数据生成的无监督深度学习方法
监督深度学习方法 原始图像数据 深度神经网络模型 图像数据生成器 样本
2
基于概率随机森林的工业过程未知故障诊断方法
随机森林 故障诊断方法 故障分类器 样本 节点
3
一种基于不平衡部分特征传输的无监督多模态腹部图像分割方法及系统
编码器模块 图像分割方法 多模态 无监督 训练样本图像
4
一种基于图像的轻量化车辆识别方法
车辆识别方法 深度学习模型 图像 全局平均池化 数据标签
5
医学超声领域知识库构建方法、相关设备及程序产品
医学超声 实体 知识库构建方法 注意力 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号