基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法

AITNT
正文
推荐专利
基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法
申请号:CN202410916486
申请日期:2024-07-09
公开号:CN119358567A
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开一种基于语言模型知识蒸馏的藏汉神经机器翻译系统构建方法,适用于人工智能及机器翻译领域。包括:S1、收集藏汉双语语料及藏汉单语语料,并进行预处理;S2、选取神经机器翻译模型作为学生模型,使用藏汉双语语料训练学生模型;S3、选取单语语言模型作为教师模型,使用汉藏单语语料训练教师模型;S4、对学生模型进行蒸馏训练,使学生模型输出概率拟合教师模型输出概率;S5、针对学生模型,计算生成译文与参考译文的差异,迭代训练及参数优化。本发明利用单语语言模型指导神经机器翻译模型进行训练,教师模型只参与学生模型训练,不参与翻译解码,可以提升解码速度,降低资源及存储需求,有利于部署到计算资源受限的平台中。
技术关键词
神经机器翻译系统 机器翻译模型 学生 蒸馏 双语语料 教师 爬取技术 生成译文 预训练模型 计算资源受限 噪声数据 文本 分词 解码器 训练集 编码器
系统为您推荐了相关专利信息
1
试题辅学讲解方法、装置、相关设备及计算机程序产品
语义 计算机程序产品 字段 意图 语音
2
基于大语言模型的辅助分层强化学习训练方法及系统
大语言模型 分层强化学习 学生 教师 文本
3
水电行业科技文档评价方法及装置
科技 知识蒸馏技术 指标 语义 特征数据提取
4
一种智慧城市3D模型的构建方法及系统
Sigmoid函数 三维模型特征 多模态 自然语言 激光探测仪
5
数字教辅出版物管理应用系统
出版物管理 知识点 隐私保护模块 学生 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号