翻译模型的训练方法、信息翻译方法、系统及相关产品

正文

推荐专利

申请号：CN202510592318

申请日期：2025-05-08

公开号：CN120471075A

公开日期：2025-08-12

类型：发明专利

摘要

本申请实施例公开了翻译模型的训练方法、信息翻译方法、系统及相关产品，此训练方法包括：从原始矩阵中低秩分解得到初始低秩矩阵；使用各源语言文本和各目标语言文本对初始低秩矩阵进行迭代训练，得到不同于初始低秩矩阵的新低秩矩阵；使用新低秩矩阵更新大语言模型的部分模型参数，以生成用于翻译待译文本的翻译模型。其中，引入初始低秩矩阵近似地模拟大语言模型的全参数，可以减少需要训练的参数数量，降低训练过程中的计算复杂度和内存占用，使得降低成本的同时，又能高效的微调大语言模型，从而生成能专门适用于翻译任务的翻译模型，减少人工工作量和翻译用时。

技术关键词

翻译模型大语言模型信息访问请求信息翻译方法矩阵文本客户端处理单元计算机程序产品参数人工工作量可读存储介质样本翻译系统训练系统处理器指令存储器网关

系统为您推荐了相关专利信息

基于映射的矩阵内置几何参数CBCT矫正方法及装置

矫正方法标记分割算法成像坐标系

一种基于谷歌足球模拟器的强化学习方法

足球比赛视频强化学习方法模拟器训练样本集大语言模型

分布式波束赋形方法及装置

分布式波束赋形天线阵列天线单元模拟退火算法光学参量振荡器

可见光图像与红外图像空间融合的目标检测方法和系统

可见光图像可见光相机 YOLO模型红外相机图像获取模块

基于能量流动关键区的航天器微振动抑振方法及系统

耦合动力学模型抑振方法航天器节点位置信息板系统

翻译模型的训练方法、信息翻译方法、系统及相关产品

站点导航

APP 下载