摘要
本发明属于资源调度技术领域,具体公开一种基于强化学习的资源调度方法及系统,包括:通过构建可动态更新的任务因果关系图,刻画任务之间的依赖与冲突关系;基于当前任务状态与因果关系,构建状态空间与动作空间,结合多目标奖励函数,采用强化学习模型训练智能代理,生成调度与资源分配策略;在策略指导下进行线性规划与启发式联合资源分配,并结合任务状态动态调整任务优先级与因果关系;通过收集执行数据并分析策略偏差,进一步调节模型结构与参数,构成完整的闭环优化过程。本发明实现了任务优先级动态调整、资源分配策略自适应更新及调度过程闭环优化,适用于多任务、多资源约束下的复杂项目管理场景。
技术关键词
资源调度方法
强化学习模型
资源分配策略
强化学习代理
资源调度系统
任务调度
训练智能
贪婪策略
延迟持续时间
偏差
项目
资源调度技术
节点
线性规划模型
强化学习策略
状态更新
动态更新
系统为您推荐了相关专利信息
自动化检测方法
分布式爬虫集群
合规性
深度强化学习模型
区块链存证
积液气井
深度强化学习
强化学习模型
订单
奖励算法
协同调度方法
两阶段
历史功率数据
深度强化学习模型
模型训练方法
涂油控制方法
强化学习模型
油箱壳体
关键工艺参数
冲压件