摘要
本发明公开一种基于编码器解码器架构的大语言模型翻译系统,步骤为:数据处理阶段,收集海量多语言双语语料进行预处理,构建高质量微调平行语料;使用预训练后的大语言模型来构建编码器‑解码器结构,采用深编码‑浅解码的模式,确认解码器端保留的层数以及编码器和解码器的连接方式;使用数据处理阶段得到的海量多语言双语语料和高质量的微调平行语料进行模型训练得到机器翻译模型;解码阶段,机器翻译模型的编码器对源语句子进行编码,再通过解码器解码生成目标语言句子。本发明利用大语言模型强大的上下文理解和生成能力,克服其推理速度慢的缺点,提高模型的翻译质量和效果,加快模型收敛速度,提高模型鲁棒性,提高了预训练方法带来的收益。
技术关键词
机器翻译模型
编码器解码器
翻译系统
双语语料
解码器结构
多语言
前馈神经网络
目标语言句子
阶段
模式
大语言模型
动态
中间层
复杂度
注意力机制
系统为您推荐了相关专利信息
颈部超声图像
解码器结构
双编码器
编码器结构
超声数据
长短期记忆网络
电力需求预测方法
注意力
数学模型
算法
多任务对抗学习
样本学习方法
预训练语言模型
命名实体识别
电力