多用户算力配额智能插队调度方法及系统

AITNT
正文
推荐专利
多用户算力配额智能插队调度方法及系统
申请号:CN202510512536
申请日期:2025-04-23
公开号:CN120029744B
公开日期:2025-07-15
类型:发明专利
摘要
本发明涉及算力资源调度技术领域,尤其涉及多用户算力配额智能插队调度方法及系统,本发明提出以下方案,首先获取待调度任务信息和GPU状态信息,并基于硬件参数、动态运行指标及物理拓扑构建当前算力特性矩阵。随后,利用融合物理模型与数据驱动算法的神经网络模型,结合注意力机制进行特征提取,并通过多轮迭代修正生成更新算力特性矩阵。基于该矩阵动态评估GPU资源分配情况,判断是否执行插队调度,并对被抢占任务进行资源重排,以优化整体算力利用率。本申请在多租户环境下有效提升算力分配效率与公平性,适用于高性能计算、深度学习训练及推理等复杂计算任务场景。
技术关键词
神经网络模型 矩阵 多用户 配额 信息处理模块 注意力机制 信息采集模块 数据驱动技术 数据驱动算法 动态 物理拓扑结构 资源调度技术 调度系统 深度学习训练 指标 参数 异构 阶段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号