摘要
本发明公开了一种面向云计算虚拟机调度的集群值分解强化学习方法,旨在克服大规模虚拟机调度固有的可扩展性障碍。集群值分解强化学习创新性地结合了分解算子和前瞻算子,能够巧妙地管理表示复杂性,同时通过Top‑k过滤算子来提高探索效率。与现有仅限于10个或更少物理服务器集群的方法不同,本发明扩展其适用范围至包含多达50个物理服务器的环境,在各种场景下的研究中表现出优秀的泛化能力,展示了本发明卓越的可扩展性和性能,还代表了强化学习在复杂、大规模云基础设施中的虚拟机调度应用的重大进步。
技术关键词
强化学习方法
物理
Q强化学习算法
策略
决策
云基础设施
神经网络参数
服务器集群
资源分配
调度器
因子
机制
样本
批量
规模
系统为您推荐了相关专利信息
电力设备
调控策略
历史运行数据
能源优化方法
数字孪生模型
轨迹
决策方法
车辆信息获取设备
规划自动驾驶车辆
加速度
路径规划方法
深度强化学习
无人机
障碍物
表达式
知识图谱构建方法
光学字符识别
隐私保护技术
多源异构数据
动态