摘要
本发明涉及多云资源调度技术领域,具体为一种多云环境下资源调度的强化学习系统及方法,包括:通过环境监控模块实时采集多云环境内多个异构云平台的第一状态性能监控数据,构建动态图结构;基于图神经网络对动态图进行多轮消息传递与节点聚合,生成融合拓扑特征的结构化状态向量;基于策略网络分析状态向量,输出包含资源选择概率和配置参数的动作参数,通过自回归解码器分析动作参数,生成跨云资源调度指令序列,并转换为应用程序接口指令执行。策略调整模块构建多云环境资源调度评分,驱动策略网络动态优化。本发明能够有效提升多云环境资源调度的全局优化能力。
技术关键词
多云环境
异构云平台
性能监控
强化学习策略
强化学习系统
虚拟机实例
解码
序列
融合拓扑特征
指令
参数
指标
实体
关系
节点
资源调度技术
数据访问
网络