一种基于小样本机器学习和知识驱动的低资源语种机器翻译方法

正文

推荐专利

申请号：CN202411099014

申请日期：2024-08-12

公开号：CN119204036A

公开日期：2024-12-27

类型：发明专利

摘要

本发明提供了一种基于小样本机器学习和知识驱动的低资源语种机器翻译方法，属于机器学习领域，该方法首先通过语言学知识库、文化背景知识库和专业领域知识库对输入的低资源语言进行预处理，然后建立一个端到端的机器翻译模型。该模型是在高资源语种上训练，然后再以少量的低资源语种数据进行模型微调，采用小样本学习策略进行训练。该模型还使用了基于图的模型并采用了Transformer神经模型进行解码生成目标语序列。最后，设计了一种有效的无监督评估方式，使用语言模型进行评估，从而有效提高了所述低资源语种的机器翻译质量和性能。

技术关键词

机器翻译方法机器翻译模型知识图谱构建样本神经网络语言模型隐马尔科夫模型低资源语言命名实体识别初始化方法文本序列节点特征解码信息更新数据无监督

系统为您推荐了相关专利信息

用于供用电合同单据OCR识别的关键信息定位方法、装置及电子设备

供用电信息定位方法单据信息定位装置文本检测模型

一种基于大数据的农产品农药残留检测分析系统及方法

农药残留检测对抗性大数据量子优化算法分析方法

考虑时序特征的裂解汽油加氢收率突变预测方法

时序特征 SMOTE算法收率汽油加氢

光伏板图像检测方法、存储介质和电子设备

图像检测方法光伏板组件神经网络模型图像分割模型多尺度特征

图像生成模型的训练方法以及图像的缺陷检测方法

图像生成模型样本重构像素缺陷检测方法

一种基于小样本机器学习和知识驱动的低资源语种机器翻译方法

站点导航

APP 下载