摘要
本发明公开了一种NCCL库的自动在线调优方法、系统、设备及存储介质,它们是相对应的方案,相关方案中可以在保证NCCL库的集合通信任务能正确执行的前提下,能够根据每一次配置的执行结果,进行在线的调优,不断地优化配置、提升性能、减少时间,适用于复杂的分布式通信场景下,同时不引入过多调优上的开销;并且相关方案中能够通过有效的调优过程,在巨大的搜索空间内快速地找到性能较优的配置;最终对多个集群和模型的评估表明,本发明在DNN模型训练上能够快速地收敛,同时能够保证相较于NCCL更高的性能收益。
技术关键词
资源分配
在线调优方法
参数
执行器
优化器
处理器
指标
跨度
可读存储介质
协议
算法
程序
集群
存储器
场景
系统为您推荐了相关专利信息
IPTV机顶盒
语义向量
数据
特征提取模型
通道
数值模拟分析方法
离心泵
耦合求解方法
湍流模型
参数
位置定位方法
钻孔机器人
手眼标定
视觉相机
标记
多模态
三维模型
扫描声学显微镜
有限元网格模型
物理