摘要
本申请涉及一种翻译模型的训练方法、文本翻译方法及生成模型的训练方法。该方法包括:将第一语言的训练文本输入至初始翻译模型中,得到模型输出文本,模型输出文本包括第二语言的模型翻译文本;基于模型输出文本的格式得到模型输出文本对应的格式奖励,格式奖励用于表征模型输出文本是否符合预定格式;基于训练文本和模型翻译文本得到模型翻译文本对应的度量奖励,度量奖励用于表征模型翻译文本的翻译质量;根据格式奖励和度量奖励,得到目标奖励;基于目标奖励和预设强化学习算法对初始翻译模型进行训练,得到目标翻译模型。该训练方法中,采用格式和度量的混合奖励方式,为强化学习提供信息丰富且有效的指导信号,能够提高翻译模型的翻译质量。
技术关键词
翻译模型
度量
强化学习算法
格式
文本翻译方法
数据
训练装置
模块
翻译装置
计算机程序产品
处理器
计算机设备
可读存储介质
存储器
分段
数值
指令
参数
系统为您推荐了相关专利信息
BiLSTM模型
染色体
引入遗传算法
日志
双向长短期记忆网络
学生管理系统
贪心算法
智能教育技术
数据格式
关系
智能监控单元
大件垃圾处理
车辆
视频监控装置
图像