摘要
本申请涉及一种语音合成模型训练方法、装置、计算机设备和存储介质。所述方法包括:获取样本语音信号,并获取样本语音信号对应的样本文本数据,以及样本语音信号对应的真实声学标记以及真实时长信息;将样本语音信号以及样本文本数据输入待训练的语音合成模型,通过语音合成模型得到预测声学标记,以及预测声学标记对应的预测时长信息;根据预测声学标记与真实声学标记之间的差异,以及预测时长信息与真实时长信息之间的差异,训练语音合成模型,以得到训练完成的语音合成模型。采用本方法能够减少丢音多音等不稳定问题的发生,从而提高语音合成模型生成语音的准确性。
技术关键词
标记
样本
大语言模型
信号
文本
模型训练方法
计算机设备
模型训练装置
语义
模型训练模块
生成语音
数据获取模块
计算机程序产品
处理器
编码
可读存储介质
存储器
系统为您推荐了相关专利信息
资源消耗预测
深度学习神经网络
任务调度方法
样本
任务调度装置
人机交互界面
元素
标签
界面特征
OCR识别方法
逻辑回归分类器
支持向量回归模型
样本
量表
指标
加工点
电信号
机器学习模型
人工智能数据
标准件