摘要
本发明涉及融入领域双语词典的泰‑汉法律领域神经机器翻译方法,属于自然语言处理技术领域。包括步骤:构建泰‑汉法律领域平行文本语料;使用工具从构建好的泰‑汉法律领域平行文本语料中挖掘领域双语词典;利用领域双语词典从泰‑汉公共数据集中筛选“伪领域”数据来扩充训练集;为泰语源句匹配领域双语词典构建词典提示数据;将词典提示数据进行编码表征融入到Transformer架构的神经机器翻译模型中;使用扩充后的训练集训练融入词典提示表征的神经机器翻译模型。通过实例分析,发现本发明方法能够提升领域关键词的翻译准确度。
技术关键词
双语词典
神经机器翻译方法
机器翻译模型
中文关键词
编码器
筛选算法
构建词典
文本
神经机器翻译系统
数据
训练集
交叉注意力机制
筛选方法
标签
解码器
系统为您推荐了相关专利信息
脑电信号分类
特征提取模型
训练样本集
编码器模块
分类方法
Agent模型
分布式传感器网络
神经图灵机
蒙特卡洛树搜索
日志
计划
监控模块
特征匹配算法
数据存储结构
评估算法
船舶冷凝器
动态预测方法
管道
识别异常数据
编码器