摘要
本发明涉及自然语言处理技领域。提供了一种基于深度学习对中医药多源数据翻译的方法,包括步骤:获取中医药相关数据,得到中医药初始数据集;对中医药初始数据集格式化处理,得到格式化数据集;对格式化数据集术语标注和文化背景标注,得到标注数据集;对标注数据集数据清洗,得到预处理数据集;对预处理数据集进行数据增强;构建初始翻译模型,对初始翻译模型训练,得到预训练翻译模型;对预训练翻译模型验证,根据验证结果对预训练翻译模型微调,对微调后的预训练翻译模型测试,并对测试结果评估;根据评估结果,对微调后的预训练翻译模型优化,得到翻译优化模型。解决了现有的机器翻译工具翻译结果不够精准,且文化适应性差的问题。
技术关键词
训练翻译模型
中医药
格式化
术语
文本
训练集
索引
深度学习模型
翻译模型训练
交叉验证方法
数据格式
分布式训练
数据项
语义
评分机制
机器翻译
采样技术
动态
系统为您推荐了相关专利信息
智能问答方法
大语言模型
智能问答装置
钢铁
机器可读指令
非结构化文本
实体关系抽取方法
大语言模型
标记
三元组