摘要
本发明提出了一种通过利用知识融合提高小语种机器翻译准确性的方法。属于小语种翻译领域,首先,选取与小语种有较强语言亲缘关系的大语种,进行大量开放语料的预训练;然后,使用半监督学习结合大量未标注小语种数据和小部分已标注小语种数据进行模型训练;训练完成后,进行神经网络修剪,去除不重要参数,使模型更加精简;最后,进行知识蒸馏,通过让小模型复现大模型的行为提高模型效率。本发明方法提高了小语种翻译的准确性,降低了模型的复杂度,提高了模型的效率,具有较强的实用价值。
技术关键词
神经网络修剪
半监督学习
标签
蒸馏
机器翻译模型
数据
双语语料
预训练模型
语法结构
参数
语句
教师
网络结构
关系
复杂度
定义
学生
系统为您推荐了相关专利信息
性预测方法
智能网联汽车
邻居
多模态
注意力机制
运维工单
历史故障信息
故障特征
电力通信网络
支持向量机模型
生成对抗网络
分析方法
节点特征
电网拓扑结构
多层感知机
可见光图像
抄表模块
红外图像特征
跨模态图像
生成红外图像