一种分布式AI训练任务的计算资源调度系统

正文

推荐专利

申请号：CN202510429677

申请日期：2025-04-08

公开号：CN120353585A

公开日期：2025-07-22

类型：发明专利

摘要

本发明涉及计算资源管理技术领域，具体公开了一种分布式AI训练任务的计算资源调度系统，任务接收模块用于接收多个AI训练任务；资源评估模块用于评估分布式计算环境中各计算节点的资源状态；任务分配模块利用深度Q网络将AI训练任务分配给合适的计算节点；任务执行监控模块用于监控已分配任务的执行情况；资源动态调整模块根据任务执行监控模块反馈的信息，动态调整计算节点的资源分配。本发明通过对任务的全面预处理和对计算节点资源状态的实时精准评估，能够为任务分配提供准确依据。利用深度Q网络进行任务分配，使系统能够不断学习和优化任务分配策略，提升资源利用率和任务执行效率。

技术关键词

调度系统深度Q网络分布式计算环境节点资源状态监控模块任务分配策略 LSTM模型资源分配资源预留机制资源状态信息资源管理技术时间序列特征动态机器学习算法神经网络模型周期性数据

系统为您推荐了相关专利信息

一种基于数字孪生的悬架弹簧多工位生产线协同调度系统

多工位生产线协同调度系统悬架弹簧深度神经网络模型工业数据处理技术

多场景协同作业的三维仿真推演与智能调度系统

智能调度系统作业场景周期剩余时长动态

一种基于动态检查点策略的大模型分布式训练故障处理方法

检查点分布式训练环境动态感知存取策略副本

一种面向时间敏感型工业应用的微服务部署与运维系统

部署算法工业监控模块控制模块执行器

基于人工智能的工业园区多目标协同优化调度系统及方法

协同优化调度方法工业园区数字孪生模型多智能体强化学习关系建模

一种分布式AI训练任务的计算资源调度系统

站点导航

APP 下载