摘要
本申请实施例公开了翻译模型的训练方法、信息翻译方法、系统及相关产品,此训练方法包括:从原始矩阵中低秩分解得到初始低秩矩阵;使用各源语言文本和各目标语言文本对初始低秩矩阵进行迭代训练,得到不同于初始低秩矩阵的新低秩矩阵;使用新低秩矩阵更新大语言模型的部分模型参数,以生成用于翻译待译文本的翻译模型。其中,引入初始低秩矩阵近似地模拟大语言模型的全参数,可以减少需要训练的参数数量,降低训练过程中的计算复杂度和内存占用,使得降低成本的同时,又能高效的微调大语言模型,从而生成能专门适用于翻译任务的翻译模型,减少人工工作量和翻译用时。
技术关键词
翻译模型
大语言模型
信息访问请求
信息翻译方法
矩阵
文本
客户端
处理单元
计算机程序产品
参数
人工工作量
可读存储介质
样本
翻译系统
训练系统
处理器
指令
存储器
网关
系统为您推荐了相关专利信息
足球比赛视频
强化学习方法
模拟器
训练样本集
大语言模型
分布式波束赋形
天线阵列
天线单元
模拟退火算法
光学参量振荡器
可见光图像
可见光相机
YOLO模型
红外相机
图像获取模块
耦合动力学模型
抑振方法
航天器
节点位置信息
板系统