基于渐进式训练的篇章级机器翻译模型的训练方法、装置及介质

AITNT
正文
推荐专利
基于渐进式训练的篇章级机器翻译模型的训练方法、装置及介质
申请号:CN202510191353
申请日期:2025-02-20
公开号:CN120031052A
公开日期:2025-05-23
类型:发明专利
摘要
本发明属于机器翻译技术领域,提供了一种基于渐进式训练的篇章级机器翻译模型的训练方法、装置及介质。本发明包括步骤S1:切分式篇章级数据增强:将篇章级机器翻译语料进行切分,将其转换成不同宽度的文档,得到初始篇章级语料;步骤S2:句对语料补充,得到篇章级语料:采用句对语料,对初始篇章级语料进行补充;步骤S3:基于步骤S2得到的篇章级语料,采用渐进式学习方法,完成篇章级机器翻译模型的训练。根据本发明,通过切分式篇章级语料增强和句子级别语料补充,解决了篇章级模型训练过程中的语料匮乏的问题;通过渐进式的篇章级模型训练,将困难的篇章级别训练,转换成由易到难的训练过程,模型更容易学习。
技术关键词
机器翻译模型 学习方法 分段 机器翻译技术 训练数据量 存储计算机程序 存储器 训练装置 处理器 编辑 可读存储介质 场景 基座 序列
系统为您推荐了相关专利信息
1
一种基于综采工作面液压支架压力数据的支架运动特征分类方法
运动特征 分类方法 阶段 点检测技术 无监督学习方法
2
一种物联网卡检测方法及装置
卡检测方法 增量学习方法 样本 更新模型参数 模型更新
3
一种基于知识蒸馏的高效异质客户端联邦学习方法
联邦学习方法 客户端 蒸馏 服务端 异质
4
一种FlexRay通信系统
FlexRay通信系统 格式 总线模块 数据 协议
5
一种光电混合计算系统及实现神经网络算法的方法
光功率 非线性 光源模块 神经网络算法 信号
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号