摘要
本申请提供一种基于混合整数规划的GPU集群下LLM模型资源分配方法和装置,涉及计算机技术领域,该方法包括:接收用户的计算资源分配请求,并基于该计算资源分配请求确定至少一个LLM模型的资源需求信息和预算上限;获取GPU集群的可用资源信息;其中,GPU集群包括多个异构的GPU;将可用资源信息、资源需求信息以及预算上限作为预先构建的资源分配模型的输入,通过预备的寻优方式求解资源分配模型的决策变量,得到目标分配方案;资源分配模型基于混合整数规划算法框架构建;基于目标分配方案为至少一个LLM模型进行计算资源分配。本方案可以利用资源分配模型得到全局最优的目标分配方案,利用该目标分配方案进行计算资源分配提高了资源利用率。
技术关键词
混合整数规划
资源分配请求
资源分配方法
集群
算法框架
计算机执行指令
资源分配装置
决策
异构
计算机程序产品
内存
分配单元
处理器通信
变量
存储器
可读存储介质
电子设备
系统为您推荐了相关专利信息
功率分配策略
资源分配方法
动态双阈值
服务质量感知
业务分配
分布式光伏逆变器
集群智能
调控系统
集群故障
设备健康状态