摘要
本发明实施例公开了一种基于强化学习的项目调度方法及装置。所述方法包括:获取目标项目的当前状态向量;其中,所述目标项目包括烟草制造企业的工程类和服务类项目;将所述当前状态向量输入至预设项目调度模型中,以输出当前状态向量对应的执行动作;其中,所述预设项目调度模型是采用强化学习算法进行训练,并采用预先构建的项目奖励函数对模型参数进行调整,得到的收敛的预设项目调度模型;依据所述执行动作,对目标项目进行动态的项目调度。采用本发明实施例的技术方案,能够根据目标项目的实时进展、风险因素和外部环境变化,动态调整目标项目的计划和任务安排,及时应对各种变化,以减少项目延期和失败的风险,提高项目的成功率。
技术关键词
强化学习算法
项目调度方法
定义
资源重分配
动态
阶段
贪心策略
调度装置
文本
参数
资源分配
企业
数据存储
指标
风险
模块
计划