摘要
本发明提供一种任务处理方法、设备和存储介质,涉及数据处理领域,包括采集任务监控数据;任务监控数据包括分布式任务系统中的设备运行状态数据、分布式任务执行数据、网络状态数据以及设备通信数据中的至少一种;对任务监控数据进行特征提取,得到多维特征矩阵,并将多维特征矩阵输入至预训练好的故障预测模型,得到故障预测结果;在故障预测结果对应的故障预测概率大于概率阈值,且持续故障时长大于时长阈值的情况下,确定故障预测结果匹配的故障类型,并执行故障类型匹配的容错恢复策略;故障类型包括任务级故障、数据级故障及模型级故障中的至少一种。本发明能够有效提高分布式任务系统的可靠性和稳定性。
技术关键词
设备运行状态数据
设备通信数据
故障预测模型
备份
检查点
非暂态计算机可读存储介质
故障运行状态
矩阵
策略
处理器
数据同步
镜像
存储器
电子设备
网络
资源
队列
消息
标识
系统为您推荐了相关专利信息
决策支持系统
农村
数据采集模块
物联网设备数据
政务信息系统
远程监控方法
远程监控系统
证书
故障预测模型
数据处理模块
K折交叉验证法
客服系统
变量
故障预防方法
策略
裂缝识别方法
图像分割算法
控制点
无人机数据处理
场景
分布式文件系统
溯源方法
锚点
高风险
注意力机制