一种基于解构式蒸馏的低资源语言翻译方法及系统

AITNT
正文
推荐专利
一种基于解构式蒸馏的低资源语言翻译方法及系统
申请号:CN202511171149
申请日期:2025-08-21
公开号:CN120671691B
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及语言翻译技术领域,尤其是涉及一种基于解构式蒸馏的低资源语言翻译方法及系统,所述方法,包括获取低资源语言与通用语言的平行语料数据;以平行语料数据作为输入构建教师模型,基于预训练完成的BERT大语言模型构建学生模型主干并对学生模型进行优化,基于教师模型和学生模型计算跨任务注意力对齐损失,基于教师模型和学生模型输出执行logits蒸馏,基于训练完成的学生模型完成低资源语言翻译的部署,本发明通过构建经全参数微调的BERT教师模型,为学生模型提供高质量的知识迁移源,同时,借助跨任务注意力对齐与logits蒸馏的双重监督,有效弥补低资源语言数据不足导致的翻译精度问题。
技术关键词
语言翻译方法 低资源语言 平行语料数据 学生 教师 蒸馏 扰动方法 解码矩阵 通用特征 语言翻译系统 语言翻译技术 序列 多头注意力机制 参数 梯度下降算法 前馈神经网络 表达式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号