摘要
本发明涉及算力资源调度技术领域,尤其涉及多用户算力配额智能插队调度方法及系统,本发明提出以下方案,首先获取待调度任务信息和GPU状态信息,并基于硬件参数、动态运行指标及物理拓扑构建当前算力特性矩阵。随后,利用融合物理模型与数据驱动算法的神经网络模型,结合注意力机制进行特征提取,并通过多轮迭代修正生成更新算力特性矩阵。基于该矩阵动态评估GPU资源分配情况,判断是否执行插队调度,并对被抢占任务进行资源重排,以优化整体算力利用率。本申请在多租户环境下有效提升算力分配效率与公平性,适用于高性能计算、深度学习训练及推理等复杂计算任务场景。
技术关键词
神经网络模型
矩阵
多用户
配额
信息处理模块
注意力机制
信息采集模块
数据驱动技术
数据驱动算法
动态
物理拓扑结构
资源调度技术
调度系统
深度学习训练
指标
参数
异构
阶段