摘要
本发明提供了一种基于小样本机器学习和知识驱动的低资源语种机器翻译方法,属于机器学习领域,该方法首先通过语言学知识库、文化背景知识库和专业领域知识库对输入的低资源语言进行预处理,然后建立一个端到端的机器翻译模型。该模型是在高资源语种上训练,然后再以少量的低资源语种数据进行模型微调,采用小样本学习策略进行训练。该模型还使用了基于图的模型并采用了Transformer神经模型进行解码生成目标语序列。最后,设计了一种有效的无监督评估方式,使用语言模型进行评估,从而有效提高了所述低资源语种的机器翻译质量和性能。
技术关键词
机器翻译方法
机器翻译模型
知识图谱构建
样本
神经网络语言模型
隐马尔科夫模型
低资源语言
命名实体识别
初始化方法
文本
序列
节点特征
解码
信息更新
数据
无监督
系统为您推荐了相关专利信息
供用电
信息定位方法
单据
信息定位装置
文本检测模型
农药残留检测
对抗性
大数据
量子优化算法
分析方法
图像检测方法
光伏板组件
神经网络模型
图像分割模型
多尺度特征