摘要
本发明涉及基于实体感知强化编码策略的神经机器翻译方法(EAEE),属于自然语言处理技术领域。在机器翻译任务中,实体的准确翻译对整体翻译质量至关重要,通常要比其他单词更难翻译。现有的方法主要聚焦于标签的融合或者替换,这样会使得模型难以有效挖掘表针实体信息。本发明基于Transformer模型,在传统编码器‑解码器框架中引入“实体强化编码器”模块。首先通过自注意力编码器生成源语句的全局语义隐向量;其次借助强化编码器与Mask机制协同增强实体语义表征。通过联合优化翻译损失函数与编码器‑解码器双端的实体感知损失函数,约束模型对标记实体的精准感知,该方法在实体翻译准确率与语义连贯性上均优于基线模型。
技术关键词
神经机器翻译方法
编码策略
翻译模型
注意力编码器
解码器框架
命名实体识别
神经机器翻译系统
非暂态计算机可读存储介质
语句
语义
交叉注意力机制
感知损失函数
处理器
计算机程序产品
自然语言