摘要
本申请涉及一种深度学习模型的训练方法及语音合成方法,其中,该深度学习模型的训练方法包括:构建深度学习模型,其中,深度学习模型包括具有多头注意力层的变换器网络和KAN网络,多头注意力层用于捕捉训练数据集中的文本数据和音频数据之间的关联关系以输出关联关系矩阵,KAN网络用于对关联关系矩阵进行线性变换;利用训练数据集来训练深度学习模型使得深度学习模型输出预测的合成语音,比较预测的合成语音和训练数据集中相应的音频数据中的目标对象的语音,确定深度学习模型的损失;根据损失调整KAN网络的权重矩阵,以更新深度学习模型,其中,KAN网络的权重矩阵用于结合共享基函数和样条插值函数来对关联关系矩阵进行线性变换。
技术关键词
矩阵
关系
注意力
语音
网络
样条
数据
文本
变换器
训练深度学习模型
机器可读介质
回归方法
计算机程序产品
音频特征
生成装置
生成方法
对象
系统为您推荐了相关专利信息
施工方法
三维地质模型
驳船
模块化浮箱
空间位置关系
分支卷积神经网络
蔬菜重金属含量
变量
融合深度学习
融合特征
延迟计算方法
Saastamoinen模型
大气折射率
精密单点定位技术
代表