一种分布式AI训练任务的计算资源调度系统

AITNT
正文
推荐专利
一种分布式AI训练任务的计算资源调度系统
申请号:CN202510429677
申请日期:2025-04-08
公开号:CN120353585A
公开日期:2025-07-22
类型:发明专利
摘要
本发明涉及计算资源管理技术领域,具体公开了一种分布式AI训练任务的计算资源调度系统,任务接收模块用于接收多个AI训练任务;资源评估模块用于评估分布式计算环境中各计算节点的资源状态;任务分配模块利用深度Q网络将AI训练任务分配给合适的计算节点;任务执行监控模块用于监控已分配任务的执行情况;资源动态调整模块根据任务执行监控模块反馈的信息,动态调整计算节点的资源分配。本发明通过对任务的全面预处理和对计算节点资源状态的实时精准评估,能够为任务分配提供准确依据。利用深度Q网络进行任务分配,使系统能够不断学习和优化任务分配策略,提升资源利用率和任务执行效率。
技术关键词
调度系统 深度Q网络 分布式计算环境 节点资源状态 监控模块 任务分配策略 LSTM模型 资源分配 资源预留机制 资源状态信息 资源管理技术 时间序列特征 动态 机器学习算法 神经网络模型 周期性 数据
系统为您推荐了相关专利信息
1
一种基于数字孪生的悬架弹簧多工位生产线协同调度系统
多工位生产线 协同调度系统 悬架弹簧 深度神经网络模型 工业数据处理技术
2
多场景协同作业的三维仿真推演与智能调度系统
智能调度系统 作业场景 周期 剩余时长 动态
3
一种基于动态检查点策略的大模型分布式训练故障处理方法
检查点 分布式训练 环境动态感知 存取策略 副本
4
一种面向时间敏感型工业应用的微服务部署与运维系统
部署算法 工业 监控模块 控制模块 执行器
5
基于人工智能的工业园区多目标协同优化调度系统及方法
协同优化调度方法 工业园区 数字孪生模型 多智能体强化学习 关系建模
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号