摘要
本发明公开一种兼容气象超算架构的多态异构智算资源融合调度方法及系统,包括创建服务集群和计算集群;构建计算集群算力聚合应用服务;创建气象超算架构智算集群融合调度支撑环境;气象超算架构智算集群内构建弹性超算服务;构建适配多态异构智算资源的软件栈支撑环境。本申请组建服务集群基于融合调度器Kubernetes调度组件调度计算集群,采用容器技术调度适配异构资源,基于气象超算架构智算集群队列管理软件接口,实现基于融合调度器Slurm调度组件调度,实现超算架构智算集群原生作业调度,采用弹性超算容器技术,构建适配超算架构智算算力及软件栈分布式环境;形成融合统一调度技术,实现统一高效调度利用,提升资源利用效率。
技术关键词
融合调度方法
集群管理节点
气象
服务集群
人工智能基础
分布式共享存储
异构
分布式训练
资源
融合调度系统
日志
加速卡
镜像仓库
加速器设备
软件
容器
调度器