摘要
本公开关于语音表征模型训练方法、装置及相关设备,该方法包括获取样本文本、对应的样本梅尔谱及对应的样本音素序列;通过初始模型的音素编码器对样本音素序列进行编码得到样本音素特征;通过初始模型的语音编码器对样本梅尔谱进行编码得到样本语音特征;对样本语音特征进行量化得到样本语音量化特征;对样本梅尔谱进行截取得到提示梅尔谱;通过初始模型的提示编码器对提示梅尔谱进行编码得到样本提示特征;通过初始模型的语音解码器,基于样本提示特征对样本语音量化特征进行解码得到预测梅尔谱;通过初始模型的音素解码器,对样本语音量化特征进行解码得到预测音素序列;基于模型损失训练初始模型得到语音表征模型。本公开可提升语音表征质量。
技术关键词
样本
语音特征
编码向量
序列
语音解码器
语音编码器
模型训练方法
文本
计算机程序产品
可读存储介质
模型训练装置
电子设备
处理器
特征提取模块
系统为您推荐了相关专利信息
大语言模型
患者
神经网络模型
训练样本集
知识图谱查询
富集检测方法
遗传算法融合
痕量药物
背景噪声抑制
多模态数据融合