摘要
本发明公开了基于强化学习资源调度的多概念多目标优化方法,具体按照以下步骤实施:步骤1、输入参数;步骤2、对参数进行初始化和计算;步骤3、根据当前迭代次数判断是否进行演化操作;步骤4、对概念i种群Popi使用差分进化和多项式变异演化产生子代Offi,将Popi和Offi合并起来构成UnitedPopi,计算其函数值F_UnitedPopi;步骤5、对每个概念的F_UnitedPopi进行环境选择;步骤6、根据新旧子代函数值F_Popi和F_PopNewi更新强化学习的基本元素;步骤7、更新种群及其函数值,令Popi=PopNewi,F_Popi=F_PopNewi;步骤8、判断适应度评估次数FES是否小于最大函数评价次数FESMAX;若满足,则输出种群的最优解和最优值;否则返回步骤3,进入下一代种群演化。本发明能够提升MCMOP算法的收敛速度和精度。
技术关键词
概念
资源
多项式
参数
元素
指标
标志
决策
变量
策略
数值
算法
精度
压力
速度
系统为您推荐了相关专利信息
智能切割机
全息玻璃
空气轴承滑块
聚焦装置
机械夹紧装置
隔声结构
吸声材料
计算机仿真分析
航天运输系统
金属板胶接