基于渐进式训练的篇章级机器翻译模型的训练方法、装置及介质

正文

推荐专利

申请号：CN202510191353

申请日期：2025-02-20

公开号：CN120031052A

公开日期：2025-05-23

类型：发明专利

摘要

本发明属于机器翻译技术领域，提供了一种基于渐进式训练的篇章级机器翻译模型的训练方法、装置及介质。本发明包括步骤S1：切分式篇章级数据增强：将篇章级机器翻译语料进行切分，将其转换成不同宽度的文档，得到初始篇章级语料；步骤S2：句对语料补充，得到篇章级语料：采用句对语料，对初始篇章级语料进行补充；步骤S3：基于步骤S2得到的篇章级语料，采用渐进式学习方法，完成篇章级机器翻译模型的训练。根据本发明，通过切分式篇章级语料增强和句子级别语料补充，解决了篇章级模型训练过程中的语料匮乏的问题；通过渐进式的篇章级模型训练，将困难的篇章级别训练，转换成由易到难的训练过程，模型更容易学习。

技术关键词

机器翻译模型学习方法分段机器翻译技术训练数据量存储计算机程序存储器训练装置处理器编辑可读存储介质场景基座序列

系统为您推荐了相关专利信息

一种基于综采工作面液压支架压力数据的支架运动特征分类方法

运动特征分类方法阶段点检测技术无监督学习方法

一种物联网卡检测方法及装置

卡检测方法增量学习方法样本更新模型参数模型更新

一种基于知识蒸馏的高效异质客户端联邦学习方法

联邦学习方法客户端蒸馏服务端异质

一种FlexRay通信系统

FlexRay通信系统格式总线模块数据协议

一种光电混合计算系统及实现神经网络算法的方法

光功率非线性光源模块神经网络算法信号

基于渐进式训练的篇章级机器翻译模型的训练方法、装置及介质

站点导航

APP 下载