摘要
本发明提供一种多语言神经机器翻译模型的训练方法、翻译方法、设备及存储介质,方法包括:使用多语言样本数据训练初始网络模型得到中间网络模型;用各语言对的样本数据分别训练中间网络模型,得到子网络模型;在每个训练步骤中,计算中间网络模型中每个权重的训练梯度,在每完成预设数量的训练步骤后分别累加每个权重的训练梯度并与权重大小相乘,得到每个权重对应的重要性分数并与剪枝阈值比较,生成剪枝掩码,对中间网络模型进行剪枝;在完成全部训练步骤后得到子网络模型;将子网络模型与中间网络模型融合后用多语言样本数据联合训练,得到多语言神经机器翻译模型;本发明能够解决多语言神经机器翻译技术在实际应用过程中出现的性能退化问题。
技术关键词
机器翻译模型
样本
网络
神经机器翻译技术
数据
多语言翻译方法
动态剪枝
标识符
指令
文本
电子设备
处理器
可读存储介质
存储器
列表
计算机
线性
算法
系统为您推荐了相关专利信息
低频天线
高频天线
复合跟踪方法
自主导航系统
驱控一体模块
智能监测系统
动态变化模型
结构稳定性特征
代表
多节点
图表
意图
解析JSON数据
Softmax函数
子模块
私有协议
通信系统
机器人控制指令
主板
CANopen主站
推荐系统
数据处理方法
机器学习模型
训练特征
异常数据