融入领域双语词典的泰-汉法律领域神经机器翻译方法

AITNT
正文
推荐专利
融入领域双语词典的泰-汉法律领域神经机器翻译方法
申请号:CN202510537288
申请日期:2025-04-27
公开号:CN120471072A
公开日期:2025-08-12
类型:发明专利
摘要
本发明涉及融入领域双语词典的泰‑汉法律领域神经机器翻译方法,属于自然语言处理技术领域。包括步骤:构建泰‑汉法律领域平行文本语料;使用工具从构建好的泰‑汉法律领域平行文本语料中挖掘领域双语词典;利用领域双语词典从泰‑汉公共数据集中筛选“伪领域”数据来扩充训练集;为泰语源句匹配领域双语词典构建词典提示数据;将词典提示数据进行编码表征融入到Transformer架构的神经机器翻译模型中;使用扩充后的训练集训练融入词典提示表征的神经机器翻译模型。通过实例分析,发现本发明方法能够提升领域关键词的翻译准确度。
技术关键词
双语词典 神经机器翻译方法 机器翻译模型 中文关键词 编码器 筛选算法 构建词典 文本 神经机器翻译系统 数据 训练集 交叉注意力机制 筛选方法 标签 解码器
系统为您推荐了相关专利信息
1
一种用于RSVP任务的脑电信号分类方法及装置
脑电信号分类 特征提取模型 训练样本集 编码器模块 分类方法
2
一种基于智能Agent模型的多阶段任务处理方法及系统
Agent模型 分布式传感器网络 神经图灵机 蒙特卡洛树搜索 日志
3
基于多模态大语言模型的无人机集群编队控制方法和系统
大语言模型 领航无人机 指令 命令 语义
4
一种计划任务智能派发的微服务架构实现方法
计划 监控模块 特征匹配算法 数据存储结构 评估算法
5
基于向量自回归模型的船舶冷凝器腐蚀动态预测方法及系统
船舶冷凝器 动态预测方法 管道 识别异常数据 编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号