通过动态样本放置加速多GPU上混合专家模型训练的方法和系统

正文

推荐专利

申请号：CN202510070284

申请日期：2025-01-16

公开号：CN120144273A

公开日期：2025-06-13

类型：发明专利

摘要

本发明属于信息技术领域，涉及一种通过动态样本放置加速多GPU上混合专家模型训练的方法和系统。该方法利用专家路由中的数据局部性与训练设备间的网络局部性，在混合专家模型的训练过程中根据专家路由结果动态调整训练样本的位置；利用动态调整后的训练样本的位置加速All‑to‑All通信并优化混合专家模型的训练速度。本发明对All‑to‑All通信的成本进行建模，并将动态样本放置问题表述为一个组合最优化问题，随后将其分为两个阶段来简化求解，并设计了相应的多项式时间算法，以确保样本放置位置可以被高效求解。本发明可以在不影响收敛性、不引入额外开销的情况下，加速All‑to‑All通信，优化混合专家模型的训练速度。

技术关键词

节点时间算法样本训练设备信道动态存储计算机程序多项式通信量两阶段 KM算法可读存储介质计算机设备速度网络存储器策略处理器数据

系统为您推荐了相关专利信息

直播违禁词实时消音替换方法、装置及计算机设备

消音直播平台文本计算机设备机器学习算法分析

模型训练方法、账户风险评估方法、装置、设备、介质

账户风险评估知识图谱构建模型训练方法节点特征矩阵

一种基于边缘计算的状态监测方法、系统、装置及设备

大语言模型数据采集设备状态监测方法标识保障作业

一种邮件存储节点选择方法、装置、设备及存储介质

节点邮件时间序列模型存储系统浮点数

审批任务的分配方法、装置以及电子设备

任务分配算法负荷信息采集单元队列电子设备

通过动态样本放置加速多GPU上混合专家模型训练的方法和系统

站点导航

APP 下载