一种多语言大模型训练方法、装置及相关设备

正文

推荐专利

申请号：CN202411739943

申请日期：2024-11-29

公开号：CN119670847A

公开日期：2025-03-21

类型：发明专利

摘要

本发明公开了一种多语言大模型训练方法、装置及相关设备，所述方法包括：获取平行语料数据，并基于子任务类型对其进行格式转换，得到与多个子任务类型对应的数据格式；将平行语料数据和数据格式输入初始多语言大模型，该模型包括子网络层，子网络层与子任务类型一一对应；计算每个子网络层的损失τ；根据每个子网络层的损失τ，计算全局损失L；利用该L对模型进行更新，得到更新后的多语言大模型。采用本发明可以提高平行语料数据的利用效率，并在不影响多语言大模型的能力的基础上提高其对低资源语种的理解能力。

技术关键词

平行语料数据多语言数据格式模型训练方法跨语言信息检索命名实体识别模型训练装置可读存储介质机器翻译处理器计算机设备模块存储器算法参数矩阵元素资源

系统为您推荐了相关专利信息

故障确定方法、模型训练方法、及电子设备

图像处理器样本模型训练方法历史性能数据特征值

一种自动驾驶车辆车道线识别方法

车道线识别方法注意力机制深度学习网络场景车辆

一种基于半监督随机森林算法的精准帮扶系统及方法

半监督随机森林标记人口统计信息基础医疗健康

模型训练方法、装置和飞行数据预测方法、装置

训练样本集模型训练方法航空器网络序列

模型训练方法、类目检测方法及计算设备

模型训练方法

一种多语言大模型训练方法、装置及相关设备

站点导航

APP 下载