摘要
本发明涉及一种容器化环境中算力资源虚拟化隔离与多层级调度方法及系统,方法包括:在Kubernetes集群的每个工作节点上部署指标采集器,实时采集节点计算资源利用情况;当接收到用户提交的计算任务请求时,Kubernetes API服务器对用户提交的配置文件进行字段合法性验证并存储;根据用户提交的配置文件和资源利用情况执行算力资源多层级调度算法,找到适配度最高的工作节点作为最优节点;自定义调度器向最优节点发送指令,要求其创建vGPU和Pod,并将vGPU挂载到对应Pod以运行计算任务;记录所述最优节点的vGPU分配信息,进行存储并更新集群。本发明实现了算力资源共享与隔离,提高了资源利用率。
技术关键词
节点
调度器
分配信息
采集器
调度算法
层级
资源监控
集群
插件管理器
容器
指标
服务器
共享计算环境
模块
自定义资源
平面监控
字段