摘要
本发明提出一种面向OODAflow操作系统的容错调度方法和装置,包括:接收智能计算任务并将其拆分为单任务,将单任务与环境健康度监测进程封装成自持的容器,等候计算设备调度;将已封装成自持的容器的单任务部署到相应计算节点;在计算节点执行任务过程中,该环境健康度监测进程实时监测当前计算节点所属计算设备的健康情况,若健康情况有故障,则当前计算节点退出任务并保存checkpoint文件;若无故障,则将任务的执行结果写回共享存储区。本发明提出的容错调度系统实现了对OODAflow操作系统任务的容错机制与高效的容错调度,保障了OODAflow操作系统处理计算任务的实时性与可靠性。
技术关键词
容错调度方法
环境健康
操作系统
节点
神经网络加速器
生成代码
调度装置
位置映射关系
信息显示设备
虚拟网桥
进程
无故障
人工智能模型
监测模块
容器
电子设备
决策
容错机制
变量
计算机程序产品
系统为您推荐了相关专利信息
任务调度算法
路径优化算法
动态障碍物
集群
拓扑网络