摘要
本发明涉及基于编辑机制的原型神经机器翻译方法、系统、电子设备、可读存储介质,属于自然语言处理技术领域。本发明包括:将训练语料的目标句子作为原型候选句子库;通过Informer编码器对源语言句子和原型候选句子进行语义特征提取,基于最大内积搜索算法,在向量空间中进行检索,得到原型序列;对获取的原型序列实施降噪处理,得到降噪后的原型序列;降噪后的原型序列和源语言句子将共同作为翻译模型的输入;双编码器结构通过分别对源语言句子和降噪后的原型序列进行独立编码并结合源语言句子和降噪后的原型序列的语义特征,生成高质量的译文。本发明能有效地识别原型序列中噪声,提高翻译准确率,适用于多种语言翻译环境。
技术关键词
神经机器翻译方法
原型
序列
语义特征提取
上下文特征
编辑
翻译模型
掩码矩阵
神经机器翻译系统
双编码器
非暂态计算机可读存储介质
解码器
交叉注意力机制
搜索算法