摘要
本发明的一种基于多目标强化学习的资源智能调度方法,步骤S1、获取资源调度场景,基于资源调度场景的不同提取若干个待优化目标;步骤S2、基于待优化目标的不同分别构建若干个优化球体,评估待优化目标的优先级,根据优先级的不同将优化球体分为固定球体以及移动球体;步骤S3、评估各待优化目标之间的相关性,并基于相关性将固定球体和移动球体映射到同一多维空间中;步骤S4、采用强化学习对移动球体的参数进行调节,并使移动球体和固定球体相交,将固定球体与移动球体相交的部分输出为资源调度策略;对待优化目标进行建模生成球体,并引入强化学习驱动球体相交,可以快速且准确获得相交区域,并作为资源最优解集合,以实现对现实资源的指导调度。
技术关键词
资源智能调度方法
球体
资源调度策略
场景
强化学习环境
皮尔逊相关系数
智能体模型
专家打分法
参数
网路
因子
核心
坐标
指标
阶段
定义
精度
系统为您推荐了相关专利信息
动态演化模型
舆情文本
人工智能模型
聚类算法
分类场景
动画建模方法
三维立体技术
捕捉系统
骨骼模型
标记
电子制冷系统
制冷设备
温度变化信息
负荷
卡尔曼滤波
沉浸式体验系统
气味释放装置
场景
紧急呼叫装置
主动降噪技术