一种基于编码器解码器架构的大语言模型翻译系统

正文

推荐专利

申请号：CN202510335480

申请日期：2025-03-20

公开号：CN120258005A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开一种基于编码器解码器架构的大语言模型翻译系统，步骤为：数据处理阶段，收集海量多语言双语语料进行预处理，构建高质量微调平行语料；使用预训练后的大语言模型来构建编码器‑解码器结构，采用深编码‑浅解码的模式，确认解码器端保留的层数以及编码器和解码器的连接方式；使用数据处理阶段得到的海量多语言双语语料和高质量的微调平行语料进行模型训练得到机器翻译模型；解码阶段，机器翻译模型的编码器对源语句子进行编码，再通过解码器解码生成目标语言句子。本发明利用大语言模型强大的上下文理解和生成能力，克服其推理速度慢的缺点，提高模型的翻译质量和效果，加快模型收敛速度，提高模型鲁棒性，提高了预训练方法带来的收益。

技术关键词

机器翻译模型编码器解码器翻译系统双语语料解码器结构多语言前馈神经网络目标语言句子阶段模式大语言模型动态中间层复杂度注意力机制

系统为您推荐了相关专利信息

基于U-Net的颈部超声分割方法及应用

颈部超声图像解码器结构双编码器编码器结构超声数据

一种电力需求预测方法

长短期记忆网络电力需求预测方法注意力数学模型算法

一种用于射电干涉阵列的主波束合成波束耦合效应消除方法

消除方法残差结构效应空洞特征提取模块

一种基于深度学习的手语翻译方法及系统

手语翻译方法语法结构手语视频信息文本语义

一种基于数据增强的小样本学习方法和系统

多任务对抗学习样本学习方法预训练语言模型命名实体识别电力

一种基于编码器解码器架构的大语言模型翻译系统

站点导航

APP 下载