翻译模型的训练方法、信息翻译方法、系统及相关产品

AITNT
正文
推荐专利
翻译模型的训练方法、信息翻译方法、系统及相关产品
申请号:CN202510592318
申请日期:2025-05-08
公开号:CN120471075A
公开日期:2025-08-12
类型:发明专利
摘要
本申请实施例公开了翻译模型的训练方法、信息翻译方法、系统及相关产品,此训练方法包括:从原始矩阵中低秩分解得到初始低秩矩阵;使用各源语言文本和各目标语言文本对初始低秩矩阵进行迭代训练,得到不同于初始低秩矩阵的新低秩矩阵;使用新低秩矩阵更新大语言模型的部分模型参数,以生成用于翻译待译文本的翻译模型。其中,引入初始低秩矩阵近似地模拟大语言模型的全参数,可以减少需要训练的参数数量,降低训练过程中的计算复杂度和内存占用,使得降低成本的同时,又能高效的微调大语言模型,从而生成能专门适用于翻译任务的翻译模型,减少人工工作量和翻译用时。
技术关键词
翻译模型 大语言模型 信息访问请求 信息翻译方法 矩阵 文本 客户端 处理单元 计算机程序产品 参数 人工工作量 可读存储介质 样本 翻译系统 训练系统 处理器 指令 存储器 网关
系统为您推荐了相关专利信息
1
基于映射的矩阵内置几何参数CBCT矫正方法及装置
矫正方法 标记 分割算法 成像 坐标系
2
一种基于谷歌足球模拟器的强化学习方法
足球比赛视频 强化学习方法 模拟器 训练样本集 大语言模型
3
分布式波束赋形方法及装置
分布式波束赋形 天线阵列 天线单元 模拟退火算法 光学参量振荡器
4
可见光图像与红外图像空间融合的目标检测方法和系统
可见光图像 可见光相机 YOLO模型 红外相机 图像获取模块
5
基于能量流动关键区的航天器微振动抑振方法及系统
耦合动力学模型 抑振方法 航天器 节点位置信息 板系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号