基于混合整数规划的GPU集群下LLM模型资源分配方法和装置

AITNT
正文
推荐专利
基于混合整数规划的GPU集群下LLM模型资源分配方法和装置
申请号:CN202510474851
申请日期:2025-04-16
公开号:CN119988043A
公开日期:2025-05-13
类型:发明专利
摘要
本申请提供一种基于混合整数规划的GPU集群下LLM模型资源分配方法和装置,涉及计算机技术领域,该方法包括:接收用户的计算资源分配请求,并基于该计算资源分配请求确定至少一个LLM模型的资源需求信息和预算上限;获取GPU集群的可用资源信息;其中,GPU集群包括多个异构的GPU;将可用资源信息、资源需求信息以及预算上限作为预先构建的资源分配模型的输入,通过预备的寻优方式求解资源分配模型的决策变量,得到目标分配方案;资源分配模型基于混合整数规划算法框架构建;基于目标分配方案为至少一个LLM模型进行计算资源分配。本方案可以利用资源分配模型得到全局最优的目标分配方案,利用该目标分配方案进行计算资源分配提高了资源利用率。
技术关键词
混合整数规划 资源分配请求 资源分配方法 集群 算法框架 计算机执行指令 资源分配装置 决策 异构 计算机程序产品 内存 分配单元 处理器通信 变量 存储器 可读存储介质 电子设备
系统为您推荐了相关专利信息
1
一种海上通信跨层协同资源分配方法及系统
功率分配策略 资源分配方法 动态双阈值 服务质量感知 业务分配
2
一种基于集群划分的主动配电网电压控制方法及系统
主动配电网电压 集群 平衡度 指标 节点
3
一种基于气候变化的分布式储能集群协调调度方法
协调调度方法 分布式储能 充放电功率 气候 集群
4
一种模块化分布式光伏逆变器集群智能调控系统
分布式光伏逆变器 集群智能 调控系统 集群故障 设备健康状态
5
专用计算芯片资源分配方法、装置、Ray框架及设备
资源分配方法 电子设备 节点 资源分配装置 框架
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号