摘要
本发明公开一种基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法,适用于人工智能及机器翻译领域。包括:S1、收集藏汉双语语料及藏汉单语语料,并进行预处理;S2、选取神经机器翻译模型作为学生模型,使用藏汉双语语料训练学生模型;S3、选取单语语言模型作为教师模型,使用汉藏单语语料训练教师模型;S4、对学生模型进行蒸馏训练,使学生模型输出概率拟合教师模型输出概率;S5、针对学生模型,计算生成译文与参考译文的差异,迭代训练及参数优化。本发明利用单语语言模型指导神经机器翻译模型进行训练,教师模型只参与学生模型训练,不参与翻译解码,可以提升解码速度,降低资源及存储需求,有利于部署到计算资源受限的平台中。
技术关键词
神经机器翻译系统
机器翻译模型
学生
蒸馏
双语语料
教师
爬取技术
生成译文
预训练模型
计算资源受限
噪声数据
文本
分词
解码器
训练集
编码器
系统为您推荐了相关专利信息
Sigmoid函数
三维模型特征
多模态
自然语言
激光探测仪