摘要
本发明属于机器翻译技术领域,提供了一种基于渐进式训练的篇章级机器翻译模型的训练方法、装置及介质。本发明包括步骤S1:切分式篇章级数据增强:将篇章级机器翻译语料进行切分,将其转换成不同宽度的文档,得到初始篇章级语料;步骤S2:句对语料补充,得到篇章级语料:采用句对语料,对初始篇章级语料进行补充;步骤S3:基于步骤S2得到的篇章级语料,采用渐进式学习方法,完成篇章级机器翻译模型的训练。根据本发明,通过切分式篇章级语料增强和句子级别语料补充,解决了篇章级模型训练过程中的语料匮乏的问题;通过渐进式的篇章级模型训练,将困难的篇章级别训练,转换成由易到难的训练过程,模型更容易学习。
技术关键词
机器翻译模型
学习方法
分段
机器翻译技术
训练数据量
存储计算机程序
存储器
训练装置
处理器
编辑
可读存储介质
场景
基座
序列
系统为您推荐了相关专利信息
运动特征
分类方法
阶段
点检测技术
无监督学习方法
卡检测方法
增量学习方法
样本
更新模型参数
模型更新
FlexRay通信系统
格式
总线模块
数据
协议