摘要
本发明提供了一种基于文档嵌入的神经机器翻译方法,属于自然语言处理技术领域。其技术方案为:首先,我们对语料库进行处理,针对具有明确边界的语料,将边界内的所有句子定义为一个文档,全局文档或者局部文档嵌入作为标记放在句子前,组合后的源嵌入和句子的目标翻译结果输入到模型中;然后,在语料库上训练一个文档级增强的神经机器翻译模型,该模型使用Transformer的编码器和解码器来处理输入的两组句子;接着,在编码器阶段有6个自注意力隐藏层和前馈层,来提取句子特征;最后,计算源句子和目标句子之间的相似度,以获得句子翻译的BLEU分数。本发明的有益效果为:预测准确率提高,帮助使用者更准确地获得文档的翻译结果。
技术关键词
神经机器翻译方法
注意力
解码器框架
矩阵
信息编码
机器翻译模型
序列
编码器模块
符号
数据
自然语言
线性
机制
样本
元素
系统为您推荐了相关专利信息
虚拟同步电机
工况参数
粒子群算法
换流器控制技术
虚拟惯量
弹簧垫片
深度学习技术
中央控制系统
量子计算技术
多层感知器
协同感知方法
语义特征
通信节点
多车协同
服务器
学习分类器
抽象语法树
Solidity智能合约
大语言模型
智能合约漏洞