DNN模型并行训练中细粒度资源调度方法及系统

AITNT
正文
推荐专利
DNN模型并行训练中细粒度资源调度方法及系统
申请号:CN202510682349
申请日期:2025-05-26
公开号:CN120610816A
公开日期:2025-09-09
类型:发明专利
摘要
本发明涉及深度学习模型训练优化技术领域,特别涉及一种DNN模型并行训练中细粒度资源调度方法及系统,将DNN模型转化为计算图表示并结合计算设备拓扑信息构建计算图;将DNN模型训练过程的计算阶段划分与各计算阶段到计算设备的资源映射建模为阶段划分与资源映射的组合优化问题;利用启发式算法对组合优化问题进行迭代求解,通过动态调整约束条件权重并最小化计算设备开销和负载差异来优化各计算阶段的计算设备资源映射。本发明在目标函数中综合考虑计算成本、通信开销、整体负载均衡以及求解时间,实现高效的计算资源分配和任务调度的优化,有助于提高大规模深度学习模型的训练和推理效率,在深度神经网络分布式并行训练领域具有较好的应用前景。
技术关键词
加速器 资源调度方法 设备拓扑信息 DNN模型 节点 启发式算法 细粒度资源调度系统 阶段 变量 内存 深度学习模型训练 决策 深度神经网络 可读存储介质 分配信息 任务调度 动态 模块
系统为您推荐了相关专利信息
1
基于区块链的物联网设备可信接入方法
可信接入方法 信用评估模型 零知识证明 区块链智能合约 上下文特征
2
一种在预设时间误差收敛的分布式观测器设计方法及系统
观测器设计方法 误差模型 李雅普诺夫函数 节点 矩阵
3
一种废碱液回收处理系统及方法
空间定位系统 路径追踪算法 粒子群优化算法 协同管理平台 设备运行状态
4
一种基于集成化结构的低节点电磁阀
集成化结构 电磁阀外壳 绕线管 节点 铆接板
5
面向恶意网络攻击的去中心化限速方法和装置
集群 限速方法 分布式系统 聚类算法 异常流量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号