摘要
本发明提出一种多任务多准则资源调度的深度图强化学习生成方法,属于应急资源调度领域;其把多任务资源调度问题建模转化为以目标导向、多约束条件下的图生成问题,包括离线模型训练阶段和在线方案生成反馈训练优化阶段。构造基于层次分析法和遗传精英算法伪标签训练数据集;设计了可行解状态特征提取单元用于表征灾害点、资源点匹配度,基于可行解状态通过图神经网络提取节点隐藏特征,以节点隐藏特征为基础采用强化学习逐步生成资源调度方案图;采用条件生成对抗网络框架,使得生成的结果更有针对性。
技术关键词
条件生成对抗网络
特征提取单元
多任务
生成资源
生成方法
深度图
层次分析法
标签
应急资源调度
数据
多约束条件
算法并行
策略
节点特征
周期
网络结构
端点