融入领域双语词典的泰-汉法律领域神经机器翻译方法

正文

推荐专利

申请号：CN202510537288

申请日期：2025-04-27

公开号：CN120471072A

公开日期：2025-08-12

类型：发明专利

摘要

本发明涉及融入领域双语词典的泰‑汉法律领域神经机器翻译方法，属于自然语言处理技术领域。包括步骤：构建泰‑汉法律领域平行文本语料；使用工具从构建好的泰‑汉法律领域平行文本语料中挖掘领域双语词典；利用领域双语词典从泰‑汉公共数据集中筛选“伪领域”数据来扩充训练集；为泰语源句匹配领域双语词典构建词典提示数据；将词典提示数据进行编码表征融入到Transformer架构的神经机器翻译模型中；使用扩充后的训练集训练融入词典提示表征的神经机器翻译模型。通过实例分析，发现本发明方法能够提升领域关键词的翻译准确度。

技术关键词

双语词典神经机器翻译方法机器翻译模型中文关键词编码器筛选算法构建词典文本神经机器翻译系统数据训练集交叉注意力机制筛选方法标签解码器

系统为您推荐了相关专利信息

一种用于RSVP任务的脑电信号分类方法及装置

脑电信号分类特征提取模型训练样本集编码器模块分类方法

一种基于智能Agent模型的多阶段任务处理方法及系统

Agent模型分布式传感器网络神经图灵机蒙特卡洛树搜索日志

基于多模态大语言模型的无人机集群编队控制方法和系统

大语言模型领航无人机指令命令语义

一种计划任务智能派发的微服务架构实现方法

计划监控模块特征匹配算法数据存储结构评估算法

基于向量自回归模型的船舶冷凝器腐蚀动态预测方法及系统

船舶冷凝器动态预测方法管道识别异常数据编码器

融入领域双语词典的泰-汉法律领域神经机器翻译方法

站点导航

APP 下载