摘要
本申请公开了一种模型的训练方法、装置、音素识别方法、设备及介质。该模型包括嵌入网络、嵌合网络和生成网络,该方法包括:获取语言的训练声学特征向量序列、训练文本特征向量序列及训练音素序列,利用嵌入网络对训练音素序列转换得到训练嵌入特征向量,利用嵌合网络基于训练声学特征向量序列和训练文本特征向量序列进行计算,得到多个训练隐向量序列,利用生成网络,基于训练嵌入特征向量和多个训练隐向量序列,计算预测音素概率向量序列和训练音素标签向量序列,基于预测音素概率向量序列和训练音素标签向量序列计算训练损失,基于损失对音素识别模型的模型参数进行调整,继续对调整后的音素识别模型训练,直至达到收敛条件得到音素识别模型。
技术关键词
文本特征向量
序列
音素识别方法
标签
编码
识别模型训练
多头注意力机制
前馈神经网络
可读存储介质
处理器
训练装置
模块
参数
存储器
计算机
电子设备
系统为您推荐了相关专利信息
数据预测方法
时间序列信息
时间序列模型
分布特征
ARIMA模型
终端
供热系统
地理信息数据
汇聚节点
数据处理系统