基于Kubernetes的GPU资源碎片智调度系统及方法

AITNT
正文
推荐专利
基于Kubernetes的GPU资源碎片智调度系统及方法
申请号:CN202511058027
申请日期:2025-07-30
公开号:CN120872609A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种基于Kubernetes的GPU资源碎片智调度系统及方法,涉及人工智能平台基础设施技术领域。为解决Kubernetes中因调度策略缺陷和缺乏自动化机制导致的GPU资源碎片化、迁移风险高等问题,所述方法通过监控集群状态,利用模拟调度算法智能识别并确定迁移候选对象;随后,创建并持久化一个GPU碎片整理任务,以该任务为载体驱动一个先扩容后缩容的无感迁移流程;该流程通过定向调度在一个新节点创建健康的Pod副本,并在新副本就绪后,平滑摘除旧副本流量,再利用Kubernetes内在的缩容机制精确移除非就绪的旧副本,最终实现任务终结与资源整合。这样,对GPU碎片的自动化、智能化治理,并通过精细化的迁移流程,在有效提高资源利用率的同时,保障了业务的连续性与稳定。
技术关键词
集群 资源 副本 调度系统 节点 列表 基础设施技术 人工智能平台 对象 定义 调度算法 调度器 风险 策略 机制 连续性 决策 载体 标记 标识
系统为您推荐了相关专利信息
1
多对多博弈任务资源分配方法、装置、设备、介质及产品
广度搜索算法 资源分配方法 端口 序列 资源分配装置
2
基于深度学习的事件线索知识增强生成方法及系统
线索 生成方法 语义向量 节点 样本
3
基于项目部位划分快速创建WBS的方法及装置
BIM模型构件 项目 数据集成模型 模糊匹配算法 施工现场管理
4
基于生成式大模型的BIM族库智能管理方法
智能管理方法 语义规则 创建系统 自然语言 Web3D技术
5
一种基于改进PPO算法的多AGV调度系统及其方法
仿真环境 特征提取模块 调度系统 策略 拓扑地图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号