一种基于元学习及语言对子网的多语言神经机器翻译模型训练方法

正文

推荐专利

申请号：CN202411852040

申请日期：2024-12-16

公开号：CN119783692B

公开日期：2025-09-26

类型：发明专利

摘要

一种基于元学习及语言对子网的多语言神经机器翻译模型训练方法，它属于机器翻译技术领域。本发明解决了现有的多语言翻译共享模型的翻译性能差的问题。本发明借助ML方法对多语言翻译模型进行初始参数优化，得到局部最优参数值，ML通过学习任务间共享表示，并对每种语言对进行自适应调整，可以减少参数干扰，保证翻译性能。通过学习语言特定子网可以获得每种语言对任务的掩码矩阵，在模型训练时每次仅仅更新输入语言对数据对应的模型参数，使多语言翻译模型能够避免参数干扰，同时提升训练效率。在后续翻译任务中，仅需要掩码矩阵中元素1对应的模型参数来参与翻译结果预测，降低了模型计算的复杂度。本发明方法可以应用于机器翻译领域。

技术关键词

机器翻译模型多语言掩码矩阵参数元学习方法词典数据目标语言句子训练集机器翻译技术英语语句注意力分割方法分词标识解码器

系统为您推荐了相关专利信息

一种中式园林程序化生成方法和系统

纹理映射技术生成方法布局建筑外观建筑模型

一种风功率异常检测与修正方法及装置

搜索优化算法掩码矩阵修正方法风电数据处理技术重构模块

一种面向智能工厂的多无人车的强化学习路径规划方法

学习路径规划方法智能工厂无人车网络策略更新

基于器件生命周期管理的主动维护方法

生命周期管理初始运行状态决策算法数据实时交互电子设备管理技术

基于弹性自适应增量学习的大模型云计算动态更新方法

动态更新方法模型更新资源分配策略节点参数

一种基于元学习及语言对子网的多语言神经机器翻译模型训练方法

站点导航

APP 下载