一种基于元学习及语言对子网的多语言神经机器翻译模型训练方法

AITNT
正文
推荐专利
一种基于元学习及语言对子网的多语言神经机器翻译模型训练方法
申请号:CN202411852040
申请日期:2024-12-16
公开号:CN119783692B
公开日期:2025-09-26
类型:发明专利
摘要
一种基于元学习及语言对子网的多语言神经机器翻译模型训练方法,它属于机器翻译技术领域。本发明解决了现有的多语言翻译共享模型的翻译性能差的问题。本发明借助ML方法对多语言翻译模型进行初始参数优化,得到局部最优参数值,ML通过学习任务间共享表示,并对每种语言对进行自适应调整,可以减少参数干扰,保证翻译性能。通过学习语言特定子网可以获得每种语言对任务的掩码矩阵,在模型训练时每次仅仅更新输入语言对数据对应的模型参数,使多语言翻译模型能够避免参数干扰,同时提升训练效率。在后续翻译任务中,仅需要掩码矩阵中元素1对应的模型参数来参与翻译结果预测,降低了模型计算的复杂度。本发明方法可以应用于机器翻译领域。
技术关键词
机器翻译模型 多语言 掩码矩阵 参数 元学习方法 词典 数据 目标语言句子 训练集 机器翻译技术 英语 语句 注意力 分割方法 分词 标识 解码器
系统为您推荐了相关专利信息
1
一种中式园林程序化生成方法和系统
纹理映射技术 生成方法 布局 建筑外观 建筑模型
2
一种风功率异常检测与修正方法及装置
搜索优化算法 掩码矩阵 修正方法 风电数据处理技术 重构模块
3
一种面向智能工厂的多无人车的强化学习路径规划方法
学习路径规划方法 智能工厂 无人车 网络 策略更新
4
基于器件生命周期管理的主动维护方法
生命周期管理 初始运行状态 决策算法 数据实时交互 电子设备管理技术
5
基于弹性自适应增量学习的大模型云计算动态更新方法
动态更新方法 模型更新 资源分配策略 节点 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号