针对异构GPU显卡的大语言模型分布式流水并行微调方法

正文

推荐专利

申请号：CN202410772174

申请日期：2024-06-16

公开号：CN118796455A

公开日期：2024-10-18

类型：发明专利

摘要

本发明属于自然语言处理技术领域，公开了一种针对异构GPU显卡的大语言模型分布式流水并行微调方法，基于多任务微调系统同时对多个LoRA模型实现微调；每个LoRA模型切分为多个部分，分布在相应数量的GPU上，并对GPU进行排序；依据用户请求，通过任务配置模块生成多个任务，并将每个任务划分为若干训练批次；按照每个任务的训练批次顺序，通过任务动态调度器结合动态调度策略生成调度方案；按照GPU正序，将调度方案发送给相应GPU上的多任务训练模块，对所有LoRA模型进行训练。本发明采用精细的模型切分和分配策略、流水线优化路径和任务负载平衡策略，能够更有效地利用多机多卡环境的计算资源，提高微调过程的整体效率，减少资源的浪费。

技术关键词

GPU显卡微调方法分析器多任务微调系统异构调度器策略动态模块精度预训练模型大语言模型任务调度自然语言矩阵超参数训练集流水线

系统为您推荐了相关专利信息

一种身份动态识别方法和装置

证件实时图像信息动态识别方法人脸识别模型对象

多元源荷预测方法、装置、设备及可读存储介质

多任务学习模型新能源发电预测序列经验模态分解算法气象

一种基于深度学习的胰腺癌预后预测系统

预后预测系统高维特征向量特征提取模块数据输入模块肿瘤

视频话题峰值的预测方法及装置

话题大语言模型异构文本特征提取模型

一种针对LLM模型的微调方法及相关设备

样本格式数据答案阶段

针对异构GPU显卡的大语言模型分布式流水并行微调方法

站点导航

APP 下载