通过动态样本放置加速多GPU上混合专家模型训练的方法和系统

AITNT
正文
推荐专利
通过动态样本放置加速多GPU上混合专家模型训练的方法和系统
申请号:CN202510070284
申请日期:2025-01-16
公开号:CN120144273A
公开日期:2025-06-13
类型:发明专利
摘要
本发明属于信息技术领域,涉及一种通过动态样本放置加速多GPU上混合专家模型训练的方法和系统。该方法利用专家路由中的数据局部性与训练设备间的网络局部性,在混合专家模型的训练过程中根据专家路由结果动态调整训练样本的位置;利用动态调整后的训练样本的位置加速All‑to‑All通信并优化混合专家模型的训练速度。本发明对All‑to‑All通信的成本进行建模,并将动态样本放置问题表述为一个组合最优化问题,随后将其分为两个阶段来简化求解,并设计了相应的多项式时间算法,以确保样本放置位置可以被高效求解。本发明可以在不影响收敛性、不引入额外开销的情况下,加速All‑to‑All通信,优化混合专家模型的训练速度。
技术关键词
节点 时间算法 样本 训练设备 信道 动态 存储计算机程序 多项式 通信量 两阶段 KM算法 可读存储介质 计算机设备 速度 网络 存储器 策略 处理器 数据
系统为您推荐了相关专利信息
1
智能人机对话方法、装置、设备及存储介质
意图分类模型 智能人机对话 关键词提取模型 多轮对话 参数
2
网页测试方法、装置、电子设备、存储介质及计算机程序产品
网页元素 定位规则 网页测试方法 指令 框架
3
一种基于ICESat-2的林下地面光子高程提取方法
地面 节点 蒙特卡洛树 搜索算法 背景噪声
4
一种无人机集群的多目标协同跟踪与决策方法及无人机
无人机集群 模糊神经网络 决策方法 节点 模糊规则
5
一种异构多核处理器任务调度方法、系统、设备及介质
异构多核处理器 任务调度方法 任务调度系统 搜索算法 序列
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号