一种基于编码器解码器架构的大语言模型翻译系统

AITNT
正文
推荐专利
一种基于编码器解码器架构的大语言模型翻译系统
申请号:CN202510335480
申请日期:2025-03-20
公开号:CN120258005A
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开一种基于编码器解码器架构的大语言模型翻译系统,步骤为:数据处理阶段,收集海量多语言双语语料进行预处理,构建高质量微调平行语料;使用预训练后的大语言模型来构建编码器‑解码器结构,采用深编码‑浅解码的模式,确认解码器端保留的层数以及编码器和解码器的连接方式;使用数据处理阶段得到的海量多语言双语语料和高质量的微调平行语料进行模型训练得到机器翻译模型;解码阶段,机器翻译模型的编码器对源语句子进行编码,再通过解码器解码生成目标语言句子。本发明利用大语言模型强大的上下文理解和生成能力,克服其推理速度慢的缺点,提高模型的翻译质量和效果,加快模型收敛速度,提高模型鲁棒性,提高了预训练方法带来的收益。
技术关键词
机器翻译模型 编码器解码器 翻译系统 双语语料 解码器结构 多语言 前馈神经网络 目标语言句子 阶段 模式 大语言模型 动态 中间层 复杂度 注意力机制
系统为您推荐了相关专利信息
1
基于U-Net的颈部超声分割方法及应用
颈部超声图像 解码器结构 双编码器 编码器结构 超声数据
2
一种电力需求预测方法
长短期记忆网络 电力需求预测方法 注意力 数学模型 算法
3
一种用于射电干涉阵列的主波束合成波束耦合效应消除方法
消除方法 残差结构 效应 空洞 特征提取模块
4
一种基于深度学习的手语翻译方法及系统
手语翻译方法 语法结构 手语视频信息 文本 语义
5
一种基于数据增强的小样本学习方法和系统
多任务对抗学习 样本学习方法 预训练语言模型 命名实体识别 电力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号