多用户算力配额智能插队调度方法及系统

正文

推荐专利

多用户算力配额智能插队调度方法及系统

申请号：CN202510512536

申请日期：2025-04-23

公开号：CN120029744B

公开日期：2025-07-15

类型：发明专利

摘要

本发明涉及算力资源调度技术领域，尤其涉及多用户算力配额智能插队调度方法及系统，本发明提出以下方案，首先获取待调度任务信息和GPU状态信息，并基于硬件参数、动态运行指标及物理拓扑构建当前算力特性矩阵。随后，利用融合物理模型与数据驱动算法的神经网络模型，结合注意力机制进行特征提取，并通过多轮迭代修正生成更新算力特性矩阵。基于该矩阵动态评估GPU资源分配情况，判断是否执行插队调度，并对被抢占任务进行资源重排，以优化整体算力利用率。本申请在多租户环境下有效提升算力分配效率与公平性，适用于高性能计算、深度学习训练及推理等复杂计算任务场景。

技术关键词

神经网络模型矩阵多用户配额信息处理模块注意力机制信息采集模块数据驱动技术数据驱动算法动态物理拓扑结构资源调度技术调度系统深度学习训练指标参数异构阶段

多用户算力配额智能插队调度方法及系统

站点导航

APP 下载