多语言神经机器翻译模型的训练方法、翻译方法、设备及存储介质

正文

推荐专利

申请号：CN202510219817

申请日期：2025-02-26

公开号：CN120146068A

公开日期：2025-06-13

类型：发明专利

摘要

本发明提供一种多语言神经机器翻译模型的训练方法、翻译方法、设备及存储介质，方法包括：使用多语言样本数据训练初始网络模型得到中间网络模型；用各语言对的样本数据分别训练中间网络模型，得到子网络模型；在每个训练步骤中，计算中间网络模型中每个权重的训练梯度，在每完成预设数量的训练步骤后分别累加每个权重的训练梯度并与权重大小相乘，得到每个权重对应的重要性分数并与剪枝阈值比较，生成剪枝掩码，对中间网络模型进行剪枝；在完成全部训练步骤后得到子网络模型；将子网络模型与中间网络模型融合后用多语言样本数据联合训练，得到多语言神经机器翻译模型；本发明能够解决多语言神经机器翻译技术在实际应用过程中出现的性能退化问题。

技术关键词

机器翻译模型样本网络神经机器翻译技术数据多语言翻译方法动态剪枝标识符指令文本电子设备处理器可读存储介质存储器列表计算机线性算法

系统为您推荐了相关专利信息

一种航空双频卫通相控阵天线复合跟踪方法

低频天线高频天线复合跟踪方法自主导航系统驱控一体模块

一种污水处理管道智能监测系统

智能监测系统动态变化模型结构稳定性特征代表多节点

基于大模型的WEB端图表美化处理方法及装置

图表意图解析JSON数据 Softmax函数子模块

一种应用于电生理机器人的通信系统

私有协议通信系统机器人控制指令主板 CANopen主站

基于数据湖的推荐系统数据处理方法、装置及存储介质

推荐系统数据处理方法机器学习模型训练特征异常数据

多语言神经机器翻译模型的训练方法、翻译方法、设备及存储介质

站点导航

APP 下载