一种基于深度学习对中医药多源数据翻译的方法

正文

推荐专利

申请号：CN202411899090

申请日期：2024-12-23

公开号：CN119358570A

公开日期：2025-01-24

类型：发明专利

摘要

本发明涉及自然语言处理技领域。提供了一种基于深度学习对中医药多源数据翻译的方法，包括步骤：获取中医药相关数据，得到中医药初始数据集；对中医药初始数据集格式化处理，得到格式化数据集；对格式化数据集术语标注和文化背景标注，得到标注数据集；对标注数据集数据清洗，得到预处理数据集；对预处理数据集进行数据增强；构建初始翻译模型，对初始翻译模型训练，得到预训练翻译模型；对预训练翻译模型验证，根据验证结果对预训练翻译模型微调，对微调后的预训练翻译模型测试，并对测试结果评估；根据评估结果，对微调后的预训练翻译模型优化，得到翻译优化模型。解决了现有的机器翻译工具翻译结果不够精准，且文化适应性差的问题。

技术关键词

训练翻译模型中医药格式化术语文本训练集索引深度学习模型翻译模型训练交叉验证方法数据格式分布式训练数据项语义评分机制机器翻译采样技术动态

系统为您推荐了相关专利信息

面向钢铁生产设备故障的智能问答方法、装置、设备及介质

智能问答方法大语言模型智能问答装置钢铁机器可读指令

实体关系抽取方法、装置、设备、介质及程序产品

非结构化文本实体关系抽取方法大语言模型标记三元组

基于大模型智能体的代码搜索方法、设备及介质

自然语言代码搜索方法代码库大语言模型文本

一种基于大语言模型与FreeMarker生成多模态报告的方法及系统

大语言模型多模态格式化模板机器可读程序

企业知识图谱驱动的法律合规审核应答方法

企业知识图谱规则集条目实体语义编码方法

一种基于深度学习对中医药多源数据翻译的方法

站点导航

APP 下载