多语言神经机器翻译模型的训练方法、翻译方法、设备及存储介质

AITNT
正文
推荐专利
多语言神经机器翻译模型的训练方法、翻译方法、设备及存储介质
申请号:CN202510219817
申请日期:2025-02-26
公开号:CN120146068A
公开日期:2025-06-13
类型:发明专利
摘要
本发明提供一种多语言神经机器翻译模型的训练方法、翻译方法、设备及存储介质,方法包括:使用多语言样本数据训练初始网络模型得到中间网络模型;用各语言对的样本数据分别训练中间网络模型,得到子网络模型;在每个训练步骤中,计算中间网络模型中每个权重的训练梯度,在每完成预设数量的训练步骤后分别累加每个权重的训练梯度并与权重大小相乘,得到每个权重对应的重要性分数并与剪枝阈值比较,生成剪枝掩码,对中间网络模型进行剪枝;在完成全部训练步骤后得到子网络模型;将子网络模型与中间网络模型融合后用多语言样本数据联合训练,得到多语言神经机器翻译模型;本发明能够解决多语言神经机器翻译技术在实际应用过程中出现的性能退化问题。
技术关键词
机器翻译模型 样本 网络 神经机器翻译技术 数据 多语言翻译方法 动态剪枝 标识符 指令 文本 电子设备 处理器 可读存储介质 存储器 列表 计算机 线性 算法
系统为您推荐了相关专利信息
1
基于数据驱动的光伏设备故障预警方法及系统
故障预警方法 神经网络模型 神经网络预测模型 故障特征 光伏设备
2
一种基于人工智能的配电网线路重过载识别方法和相关装置
波动特征 识别方法 协方差矩阵 线路 卡尔曼滤波器
3
基于用电行为聚类分析的楼宇短期负荷预测方法及装置
LSTM模型 短期负荷预测方法 动态时间弯曲 典型 曲线
4
制造业数字孪生三维可视化管控方法及系统
动态运行状态 设备健康状态 数字孪生模型 设备运行数据 管控方法
5
一种使用物理引导和数据驱动的多任务正演模拟加速LBFGS反演的方法
多任务神经网络 反演方法 动态链接库 地球物理学技术 三次样条插值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号