基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法

正文

推荐专利

申请号：CN202410916486

申请日期：2024-07-09

公开号：CN119358567A

公开日期：2025-01-24

类型：发明专利

摘要

本发明公开一种基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法，适用于人工智能及机器翻译领域。包括：S1、收集藏汉双语语料及藏汉单语语料，并进行预处理；S2、选取神经机器翻译模型作为学生模型，使用藏汉双语语料训练学生模型；S3、选取单语语言模型作为教师模型，使用汉藏单语语料训练教师模型；S4、对学生模型进行蒸馏训练，使学生模型输出概率拟合教师模型输出概率；S5、针对学生模型，计算生成译文与参考译文的差异，迭代训练及参数优化。本发明利用单语语言模型指导神经机器翻译模型进行训练，教师模型只参与学生模型训练，不参与翻译解码，可以提升解码速度，降低资源及存储需求，有利于部署到计算资源受限的平台中。

技术关键词

神经机器翻译系统机器翻译模型学生蒸馏双语语料教师爬取技术生成译文预训练模型计算资源受限噪声数据文本分词解码器训练集编码器

系统为您推荐了相关专利信息

试题辅学讲解方法、装置、相关设备及计算机程序产品

语义计算机程序产品字段意图语音

基于大语言模型的辅助分层强化学习训练方法及系统

大语言模型分层强化学习学生教师文本

水电行业科技文档评价方法及装置

科技知识蒸馏技术指标语义特征数据提取

一种智慧城市3D模型的构建方法及系统

Sigmoid函数三维模型特征多模态自然语言激光探测仪

数字教辅出版物管理应用系统

出版物管理知识点隐私保护模块学生文本

基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法

站点导航

APP 下载