摘要
本发明提供一种多语言神经机器翻译模型的训练方法、翻译方法、设备及存储介质,方法包括:使用多语言样本数据训练初始网络模型得到中间网络模型;用各语言对的样本数据分别训练中间网络模型,得到子网络模型;在每个训练步骤中,计算中间网络模型中每个权重的训练梯度,在每完成预设数量的训练步骤后分别累加每个权重的训练梯度并与权重大小相乘,得到每个权重对应的重要性分数并与剪枝阈值比较,生成剪枝掩码,对中间网络模型进行剪枝;在完成全部训练步骤后得到子网络模型;将子网络模型与中间网络模型融合后用多语言样本数据联合训练,得到多语言神经机器翻译模型;本发明能够解决多语言神经机器翻译技术在实际应用过程中出现的性能退化问题。
技术关键词
机器翻译模型
样本
网络
神经机器翻译技术
数据
多语言翻译方法
动态剪枝
标识符
指令
文本
电子设备
处理器
可读存储介质
存储器
列表
计算机
线性
算法
系统为您推荐了相关专利信息
故障预警方法
神经网络模型
神经网络预测模型
故障特征
光伏设备
波动特征
识别方法
协方差矩阵
线路
卡尔曼滤波器
LSTM模型
短期负荷预测方法
动态时间弯曲
典型
曲线
动态运行状态
设备健康状态
数字孪生模型
设备运行数据
管控方法
多任务神经网络
反演方法
动态链接库
地球物理学技术
三次样条插值