摘要
一种集群任务容器管理方法,应用于超算集群,超算集群包括管理节点与多个计算节点,方法包括:构建轻量状态数据库,记录任务全生命周期状态,生命周期包括提交、调度、容器启动、端口映射及回收阶段;设计基于位图的端口池机制,按固定步长生成可用端口序列,并通过内存锁确保端口申请的并发唯一性;在管理节点建立SSH隧道,将本地端口转发至目标计算节点的SSH端口;实施容器生命周期管理,定期扫描隧道状态,发生异常时自动触发容器状态检查及隧道重建;通过API将所有状态事件写入轻量状态数据库,轻量状态数据库支持任务查询与连接健康检查。本方法能够支持任务级别状态持久记录、端口自动调度与恢复,提升平台稳定性、资源利用效率。
技术关键词
容器管理方法
生命周期管理
集群
端口
节点
扫描隧道
容器管理系统
机制
跳板
唯一性
哈希算法
内存
调度系统
文件系统
阶段
控制模块
序列
系统为您推荐了相关专利信息
拓扑地图
语义实体
动态场景
节点休眠机制
构建系统
柔性车间调度
融合算法
深度强化学习模型
异构
节点特征